五千年(敝帚自珍)

主题:从PDF文件中提取文字的问题。 -- johny

共:💬31 🌺5
全看分页树展 · 主题 跟帖
家园 那就OCR呗....现在比较流行的是汉王识别系统

哪怕原文稍微有些倾斜,都可以对付得来的。

去年用扫描仪+汉王作了一本书....《杜鹃蛋》,嘿嘿

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河