摘要: | 科技發達的今日,電腦已是一項現代人不可 或缺的工具.在過去國人曾經強調電腦中文化, 但隨著人性化思潮的影響,則電腦不僅要中文 化,同時還要在人機溝通上,能夠輸入筆式化.也 就是要能有中文的筆式電腦,而其中的關鍵技 術,在於如何正確快速的辨認手寫的中文字,而 發展線上中文文字辨認系統( On-line Chinese Character Recognition, OLCCR ),便可以突破此一瓶頸. 而 OLCCR 所面臨的主要困難,就是中文字的字數 多(常用字 5401 個,次常用字13051個)、結構複雜. 因此如何找出每個字具有代表性的穩定特徵, 且快速正確的辨識,就是我們所要努力的目標. 本研究以全字根模組(all subword model)做為辨識的基礎.所謂全字根模組是在辨認中文字前,根 據演算法則把中文字分成字根的組合,然後利 用四邊掃描法選取候選字根,最後再用字根組 字法得出辨識結果.由於超過90%的中文字由字 根組成,因此中文字根據字根作為辨識和分類 的方法,不僅可以提高系統的速度和正確率,更 可增加系統的穩定度,而且在增加可辨識字數 時,並不會使模板所佔記憶體空間增加多少.另 外此方法配合本實驗室對中文字的四邊特徵抽 取(surrounding feature)、區域穩定特徵比對和中文 認知字根的抽取等方法研究的經驗,可以預期 本研究計劃將會有很好的成效;同時為了提升 文字識別的處理速度,我們也要研製其中的比 對辨認電路板,本實驗室也有相關的論文研究 經驗.此電路板的中央處理單元為 MC68000,預計 可使系統的處理速度提升 5 倍左右.而使得筆 式輸入中文字更為可行,促進中文筆式電腦的 早日來臨,使中文資訊更普及化. ; 研究期間 8408 ~ 8507 |