pdf已經(jīng)是圖片格式了 要轉(zhuǎn)word只能如下
一、“選擇文字工具,選好了貼到word里”
如果你的PDF文件是用文字制做而不是圖片制做的,可以“在Adobe Acrobat 7.0中有選擇文字的工具,可以選好了貼到word里”。但是根據(jù)你介紹的情況,你的PDF文件是用圖片做的,所以不能用這種方法。
二、批量截圖
截圖的辦法對于不是很清楚的圖片來說,并不可取,因為它要么會損失信息,要么會如樓主所說加大工作量。
我建議你先用Adobe Acrobat中的導(dǎo)出功能,將這個文件導(dǎo)出為圖像。做法:在上面菜單上選文件>導(dǎo)出>提取圖像為>JPEG文件(其他二種也行,JPEG文件比較小),再按提示,選擇一個適當(dāng)?shù)奈募A,保存圖像 。
這種方法保存下來的一張張圖片,比你一頁頁截圖省力多了,而且保留了原文件的全部信息。不過500頁可不一個小數(shù),會很慢,但至少不用你親自動手干預(yù)了。
三、批量識別
如果你想進(jìn)行編輯,就必須進(jìn)行OCR識別。關(guān)鍵在于你如何能夠批量進(jìn)行這個工作。
好一點的OCR軟件都可以一次導(dǎo)入多幅圖片進(jìn)行識別,然后輸出。不過,好像500頁的確有點多了,我從來也沒有超過50頁的記錄,通常也就是二、三十頁。就算50頁,也比一頁一頁強(qiáng),是吧?
我用過不少OCR軟件,覺得漢王文本王、清華紫光TH比較好用。它們的識別率都非常高,還可以識別表格、繁體字、英文、豎排文字等;輸出方式也很靈活,可以只輸出文字,也可以按原稿排版格式輸出WORD文件;使用起來也都不復(fù)雜。 不知你用的是什么版本的漢王,識別率會那么低。我有的時候識別質(zhì)量很次的報紙上的文章,它的識別率也還是可以接受的。
九云圖是由上海凈閱科技有限公司研發(fā)運營的 P2M 文檔發(fā)布平臺。公司成立于 2014 年 8 月,創(chuàng)始團(tuán)隊具有多年文檔處理、云端存儲、WEB 展現(xiàn)的研發(fā)經(jīng)驗和技術(shù)積累,致力于為用戶提供 P2M 的文檔發(fā)布平臺。P2M(PC to Mobile)是一個全新的概念,是未來發(fā)展的趨勢。智能手機(jī)的強(qiáng)大和平板的便捷,使得人們的生活、娛樂和辦公不再單一地依賴電腦來實現(xiàn)。P2M 就是將電腦上面原有的軟件程序、文檔資源等通過中間件平臺移植到手機(jī)、平板上面使用,從而達(dá)到不再受地域和空間的限制,更全面、更便捷地實現(xiàn)工作和娛樂。