close

論文翻譯

我目前的工作可以算是OCR(Optical Character Recognition,光學字元辨識),就是讓影象中 翻譯文字釀成真正可以在電腦中被辨認編輯的文字資料,車牌辨識其實就是此中一個最廣用 翻譯案例!我以研究車牌為出發點,意外地受到業界重視,開始幫手許多領域去影像中「找字元」!掃描文件是在2D的根本上做,拍攝 翻譯照片則是在3D的根蒂根基上處置懲罰,前者已不簡單了,後者變數就更多!

事實上機器進修 翻譯強項是和OCR軟體近似 翻譯!首要用於「認知」那個圖案是甚麼意義!今朝我除做車牌辨識以外,最大項的工作就是替以OCR為基礎,推出影象辨識軟硬體商品的公司辦事。他們需要我幫忙確當然不是若何辨識奇新鮮怪的字,而是處理從原始影像中准確抓出字元區塊的這個步調!

我提了一下準備做藥盒辨識 翻譯議題,很多機械進修或深度進修的建議又來了!明顯在這個 AI 的新時期,機械進修變成顯學了!事實上我對此也是略知一二 翻譯,但實際操作的手藝上確切是沒經驗,但我估計研發 翻譯時候與獲得足夠樣本或資料庫 翻譯本錢較高,讓我不會將機器學習看成最好的選項,甚至我判定較合適用這類體式格局解決 翻譯案子,就直接推辭或保舉他人做了!

所以我做 翻譯工作很像二廚替大廚準備食材,就是影象處理需要的準備步調,灰階化→二值化→輪廓化→切割為自力字元目標。簡單嗎?很難的!因為狀態特別很是多,如前面的圖形吧?點矩陣列表機印的文字,在影象上根本就是離散的方針,如何「融會」它們成為一個單一方針送給OCR辨識就是個很難處置的邏輯。相對的,印刷字太擠,影像相連沾在一起時,兩個字被當作一個字送去辨識,OCR固然沒這麼聰明,怎麼比對答案都是錯的!此時我就必須「切香腸」,准確切開相連方針之後才能餵給。-> 翻譯社|,-> 翻譯公司|的-> 翻譯OCR

所謂機器「學習」就隱含了測驗考試毛病的意義,感覺上OCR資料庫是死 翻譯,機器學習多了一些想像的空間,好像他會積累經驗?或最少比定型資料比對更有彈性!然則列位可想到運算時候的問題?OCR軟體目前很貴,主要原因就是它可以非常快速的從極度多的可能字元中比對出效果,它的價值是「快」不是聰明!所以這些年它不但沒有被機械進修軟體取代,還繼續保持很貴

我「臨時」不用機器學習的原因也差不多!用機械進修機制來辨識字元,對我目前 翻譯需求來說沒必要 翻譯社至於用機械進修幫我判斷字元形狀位置?判斷方針是不是需要融合或切割呢?這是抽象思考,AI目前還沒這麼伶俐啦!若是放手讓他們「自我學習」可能會算到天荒地老!使用軟體 翻譯客戶鐵定會抓狂的!請記得:機械進修的弱點是需要很多計算,你的手機或PC效能可以跟Alphago相比嗎?

當然這些跟我的工作算是無關的,即便是辨識藥盒上的字串,他們也不是要我「翻譯全文」只是要抓出批號與過時日,我的大麻煩並非「字很奇怪」而是字的位置範圍欠好肯定,必須有一個程式在任何色彩、字元巨細與印刷體例下,即便字元沾連或破碎我都能正確圈出那些字來辨識,因為字的可能性不會太多,我不會用OCR,否則買授權就是我自己工作報價 翻譯很多多少倍了!

如果OCR或機械進修軟體完全沒有字元在哪裡的出發點資訊,那就必須在原圖上逐點掃描,乃至也不知道方針巨細,一個字模上是10x20的字型,在原始影像上多是任何寬高比1:2的圖形,加上會傾斜乃至變形!OCR或機器學習軟體即使能跑出正確成績,所需時候也會慢到讓人無法接受 翻譯OCR自己固然有「基本翻譯字元鎖定程式,然則能力有限,碰到印刷複雜或不是極清楚 翻譯影象就很容易辨識失敗。

OCR包羅兩個首要階段,先是要在影象中鎖定准確的字元位置,其次才是依據鎖定的目標區塊開始翻箱倒櫃,用資料庫中的資料比對出那是甚麼字(或圖案) 翻譯社那些翻箱倒櫃辨識奇形異狀文字 翻譯工作今朝的OCR軟體已做得很好,是個和作業系同一樣成熟複雜的商品,所以這部分根本沒我 翻譯事!車牌辨識因為只需辨識少數 翻譯字元與字型,這部分我就簡單自己做了,沒必要買OCR軟體,若是買了就賠死了!

所以不要誤會我對機械進修有偏見!還誤解我是本身不懂才有意不用的!真的不是這樣!我曾經最厭惡JavaScript,可是HTML5興起後,一年之內我就變成JS的專家,還能講授生用JS寫出近似Line的通訊軟體!晚期的學生以為我一直都是寫JS 翻譯人!學姊返校跟我創業時卻很驚訝:「教員你不是一貫喜好用VB,很討厭JS的嗎?怎麼學弟們最熟練 翻譯說話是JS,而不是VB了?」以此觀之,我是對峙抗拒新科技的老固執嗎?你們本身判定吧!

許多人會懷疑:「你底子不消機器進修的手藝,做那麼多影象辨識的工作不會受到限制嗎?會不會很多事做不好?做不快?或做不出來啊?」就像某位老闆竟然沒有手機?這不會影響經商嗎?其實今朝對我來講是不會的,緣由且聽我道來!



引用自: http://blog.udn.com/yccsonar/105937889有關翻譯的問題歡迎諮詢天成翻譯社
arrow
arrow
    文章標籤
    翻譯社
    全站熱搜
    創作者介紹
    創作者 katrinx02qw6 的頭像
    katrinx02qw6

    katrinx02qw6@outlook.com

    katrinx02qw6 發表在 痞客邦 留言(0) 人氣()