技術ふれあい2001  
研究・指導事例成果発表

 データマイニングによる文書校正支援技術の開発
 情報指導部 ○上田芳弘 加藤直孝 林克明 金沢大学 木村春彦

データマイニングは,データベースなどに蓄積した大量データの中から有益な知識を発掘,発見するための技術である。本研究では,組織内で行われる文書校正に関するデータを蓄積し,データマイニングを用いて,文書校正に役立つルールを抽出する技術の開発を目的とする。以下,校正とは誤字や脱字の修正とともに文法や意味などの推敲を含むものとする。組織内では一般に,文書は情報周知をはじめ,知識の共有や組織の意思表現のために作成され,文書作成者とは別の校正者が様々な側面から校正を行っている。従って,校正結果は校正者の長年の業務経験が反映された重要な情報と考えられる。しかし,この校正作業は一般に紙面上で行われるため,校正結果の情報は組織内で蓄積,共有されていない。そこで,校正前後の文書ファイルの差分から校正データを生成し,このデータにデータマイニングの技術を応用して校正ルールを抽出する。この抽出時に適用度と呼ぶ新たな指標を導入し,ルールの抽出後に適用度を学習させて文書の種類ごとに異なる校正を可能とする。これにより,校正結果の情報を組織内で知識として蓄積,共有することを目指す。


全文(PDFファイル:47KB、4ページ)
  簡易テキスト版

PDFファイルをご覧になるためには、アクロバットリーダーが必要です。
ダウンロードはこちら


* トップページ
* 技術ふれあい2001もくじ

前のページ

* 次のページ