コピペレポート発見ソフト開発!

石川にある金沢工業大学の教授が開発したそうです。

http://www.asahi.com/life/update/0525/TKY200805250186.html

 電子データで提出された文章をソフトに入力すると、翻訳ソフトに使われている「形態素解析」という技術で、文章を文節や単語に分解。それぞれの文節や単語をネット検索し、類似した文章がネット上で見つかれば、URLを表示して知らせる。複数のリポートを比べて、学生同士が写し合っていないかチェックすることもできる。

 杉光さんは一昨年、学生に課したリポートを読んでいて、学生2人の表現が似ていることに気付いた。共通する文章をネット検索したところ、あるブログからの引き写しとわかった。同僚もコピペに悩んでいると知り、昨夏、開発に着手した。

すまんがもっと前からうちが所属していた研究室(というか研究グループ)では開発していたんだ。

CiNii 論文 -  n-gram を用いた学生レポート評価手法の提案

電子情報通信学会論文誌. D-I, 情報・システム, I-情報処理
The transactions of the Institute of Electronics, Information and Communication Engineers. D-I
Vol.J86-D-I, No.9(20030901) pp. 702-705
社団法人電子情報通信学会 ISSN:09151915

とか
CiNii 論文 -  複数のWebページから剽窃したレポートの発見支援システムの実装

情報処理学会研究報告. コンピュータと教育研究会報告
IPSJ SIG Notes
Vol.2006, No.130(20061209) pp. 41-46
2006-CE-87-(6)
社団法人情報処理学会 ISSN:09196072

で発表していたりしたんだ。

研究グループでは「形態素解析」ではなく、「n-gram」を使って解析していた(と思う)。
研究していた本人ではないので、内部処理まで知らないが同期の友人が作っていたので夜中にタバコをすいながら議論していたのを今でも覚えている。

こういうのがあると、やっぱり研究しているだけじゃだめなんだと思う今日この頃。