PDF複製出來的文字事變碼(字型問題)－mannudtup16w2@outlook.com

英文論文翻譯翻譯社該 pdf 檔便會內嵌一推字型，

就教是不是有對象可以把內嵌的字型給撈出來，或有其他方法可以准確的轉成doc?

我用Acrobat的編纂文字複製一樣是亂碼，就算不會亂碼也要一頁一頁複製，應當也不會比OCR快....
請利用流灠器打開文字檔，再把編碼選萬國碼，看看是否是照樣亂碼。
很不幸地，我今朝知道的解法都得動用OCR，步調稍為省事的是用ACROBAT將PDF檔轉為JPEG，再用ACROBAT開啟轉出的JPEG，接著套用ACROBAT內建的OCR，最後再轉存為DOC便可。
請參考此文，我測試結...(恕刪)

你照樣乖乖OCR吧....英文的OCR起來總比中文的容易多了吧

哇~豈非您也是處置過...(恕刪)

SCANSOFT PDF CONVERTER PRO 彷佛是一般convert

有些 ebook 一ocr 就軟體 crash .

vane wrote:

爬了文，看到是內嵌包的字型在自己的電腦沒有所造成
中文 OCR光學文字辨認東西 Readiris Pro

piligo wrote:

而且如是圖片 scan 的中文字+ 圖的雜誌不知道
也許看了一下,亂碼部分都是pdf裡斜體字翻譯社所以你只要針對亂碼部分做批改就能夠了
PDF OCR

可能中文 ocr 要別軟體吧

下載點二
謝謝供應方法

謝謝您的處置懲罰範本

solid convert 不克不及會是亂碼
剛try 過中文的圖片

謝謝人人

哇~難道您也是處置過相同的電子檔，連原始檔有467頁包了351種字型也都吻合 XD

經由底下幾項測試
你照舊乖乖OCR吧....(恕刪)

vane wrote:
因為翻譯公司的檔案都是英文，所以存好是不會有亂碼的翻譯

google
很不幸地，我今朝知道...(恕刪)

Adobe Reader裡頭有一個功能是，檔案==>另存文字，存好後若是用筆記本開啟會亂碼的話，
話說既然PDF可以把字型包進去，卻不能抽出來，等候有人開發出此對象
哇~難道您也是處置懲罰過...(恕刪)

附檔是gdocs轉出來的翻譯社再下載轉存為txt,排板可能要調整一下
附加緊縮檔: 201110/mobile01-06cb6556b494404edd636eaa6d3a9384.zip

請參考此文，我測試了局是可行的，惋惜辨識準確率未達100%。

附件是我轉存的結果。
我不想動OCR是因為有400多頁 @@

冊本掃描後操縱 Acrobat 10 OCR 的 ClearScan 進行辨識，

會主動將 PDF 或圖片中可以辨識的文字擷掏出來，並紀錄在 Google 文件中做後續編纂
不外格局字的大小似乎都跑了 ..
In Chapter 7, I have added a new section titled Citing Sources Orally that

看不懂

==> try
1.透過Adobe Reader複製後貼在任何編纂軟體都是口口口口口口口口口口口口口口口口
2.透過http://convertpdftoword.net轉成doc是空白檔案
3.透過http://www.pdfonline.com轉成doc是_RI[_WIGXMSR_XMXPIH_'MXMRK_7SYVGIW_3VEP
4.透過Solid Converter PDF轉出來跟RI[_WIGXMSR_XMXPIH_'MXMRK_7SYVGIW_3VEP類似
5.透過Foxit PDF Editor要改字型卻泛起新字型的編碼與某些選取對象的今朝字型不相容翻譯變動字型功課已被勾銷翻譯

piligo wrote:

只能說掃描時要好好掃，辨識率高，字型的種類才會降落。
翻譯公司可以操縱google docs

本篇文章引用自此: https://www.mobile01.com/topicdetail.php?f=511&t=2391720有關各國語文翻譯公證的問題歡迎諮詢天成翻譯公司02-77260931