IT JOURNAL トップソフトウェアKDDI研究所、インターネット上の有害情報を高精度に自動識別するシステムを開発

ソフトウェア

2011年10月25日 23:26

インターネット上の有害情報を高精度に自動識別するシステムを開発 有害情報の「見た目」と「内容」を分析、識別精度95%を達成  株式会社KDDI研究所(本社:埼玉県ふじみ野市、代表取締役所長:中島 康之)は、インターネット [...]

KDDI研究所、インターネット上の有害情報を高精度に自動識別するシステムを開発

インターネット上の有害情報を高精度に自動識別するシステムを開発

有害情報の「見た目」と「内容」を分析、識別精度95%を達成

 株式会社KDDI研究所(本社:埼玉県ふじみ野市、代表取締役所長:中島 康之)は、インターネット上にあるWebページや掲示板などの書き込みに含まれる有害情報を柔軟かつ高精度に自動識別する『有害コンテンツ高度識別システム』を開発しました。本システムは、(1)有害情報の「見た目」と「内容」の両方を分析して高精度に識別できる高い識別精度、および、(2)適用先ごとの有害判定基準の違いに配慮し、有害としたい情報を72カテゴリから柔軟に設定できる高い柔軟性を特長とします。

 なお今回の技術は、独立行政法人情報通信研究機構からの委託研究である「インターネット上の違法・有害情報検出技術の研究開発」の研究成果です。

【背景】

 インターネット上のWebページ数の増大に伴い、出会いや犯罪予告などを目的とした有害ページも急増しており、現在、ブラックリスト※1方式や、コンテンツフィルタリング方式※2を代表とした有害情報フィルタが注目されています。特に単語に基づき有害情報を識別するコンテンツフィルタリング方式は、新たなURLであっても識別可能であることが利点であり、近年利用が増加していますが、単語を追加し過ぎると識別誤りも増えるため、必要なレベルまで識別精度が高くならないという課題がありました。また、有害情報フィルタは青少年向けだけでなく、企業のWeb閲覧制限用途にも利用されていますが、この場合、娯楽関連カテゴリも制限対象となる場合もあり、このような判定基準の柔軟な設定が必要とされていました。

【今回の成果】
 このたび、こうした課題を解決するために、有害情報の柔軟かつ高精度な自動識別機能を簡単に利用できる『有害コンテンツ高度識別システム』を開発しました。利用者はまず、判定システムを利用する前に、「誹謗中傷」や「アダルト」「オンラインゲーム」「掲示板」などの72カテゴリの中から有害としたいカテゴリを自由に組み合わせることで、フィルタリング対象を簡単に設定できます。識別精度については、コンテンツに含まれる有害な単語検出やその係り受け※3関係抽出などの精密な「言語的コンテンツ分析」と、判定済みコンテンツとの内容の類似判定や、有害の可能性が高い背景色やリンク先の検出などの高速な「外形的コンテンツ分析」を組み合わせた総合判定により、高精度化を両立することに成功しました。識別精度※4はおよそ95%を実現しています。また、本システムはWebインタフェースを搭載しており、Webブラウザ経由で簡単に利用することができます。

【今後の展望】
 現在、数社と協力して、開発したシステムの実証実験を実施しており、2012年度のサービス開始を予定しています。また本システムを2011年10月26~28日に幕張メッセ(千葉市美浜区)で開催される第1回情報セキュリティEXPO【秋】のKDDI研究所ブース内に出展致します。

 ※実証実験に参加して頂ける事業者は随時募集中です。(2011年12月末終了予定)

以上

スパムメール CHECKER

閲覧ランキング

  1. LGエレクトロニクス、省エネモード搭載モデルの液晶モニター「IPS231P-BN」を発売 - 18,687 views
  2. リンクス、iChargeシリーズ「USBハンドウォーマーIC-Warmer」のノベルティ事業を開始 - 17,815 views
  3. 富士通、最大23.2ペタフロップスの理論演算性能が可能なスーパーコンピュータ「PRIMEHPC FX10」を販売 - 17,699 views
  4. 「BookGate」でEPUB3.0形式の電子書籍提供 - 17,691 views
  5. 7/11(水)C&R社×CSS Nite クリ☆ステVol.3 「Web制作でも重要なIllustratorのアレコレ」開催のご案内 - 17,635 views

記事の掲載をお考えの方へ

広告の掲載をお考えの方へ

お問い合わせ

ページの先頭へ