基于深度学习的智能钢琴演奏机器人-客户端 https://github.com/ElderBacon/Pyanist-Client
Linux Ubuntu 20.04 LTS
Intel Core i3-10100
NVIDIA T600 GPU
接受由客户端传入的图片,并使用 Paddle OCR 对图片进行识别,得到音符信息并传回客户端
- 与服务器之间建立Socket连接
- 接收客户端发送的图片
- 使用 Paddle OCR 对图片进行识别
- 将信息以字符串的形式返回给客户端
- 使用Socket进行传输时容易产生误码,故加入了信息大小的检查作为校验,可在包中加入更多信息来确保传输的正确
- 服务端直接调用 Python.h 头文件失败,故采用手动连接字符串方式来调用
- executeCMD 函数用于执行系统命令,同时可读取终端中的输出并保存起来
- 将收到的文件用日期命名,以免文件重名的同时还能方便管理
使用GPU进行预测,单张乐谱时间在2秒左右,若采用CPU运算,性能显著降低。正在考虑能否部署至FPGA上
待续