特開平10−40156を読む

「有害」概念の定義にCRYPTOREC方式を」&「何を何時みせるかは親の権利だが、親にもいろいろ」との記事を読んで以前の日記で触れたWebフィルタリングの一番古い特許を読んでみたくなったので読んでみました(どういう動機だw)。
あう!!!

「(11)【特許番号】第2980030号」として登録されてるじゃありませんか!!
というわけで、GoogleやYahoo、MSNがツールバーにキーワードフィルタリングブラウズ機能を内蔵させるとNECの特許に引っかかる可能性が出てきましたw

(11)【特許番号】第2980030号
(22)【出願日】平成8年(1996)7月19日
(71)【出願人】【氏名又は名称】日本電気株式会社
(57)【要約】
【課題】WWWブラウザにおいて、例えば青少年に有害なページの表示を制限することを可能とする方式の提供。
【解決手段】表示ページのHTMLデータ内のテキストデータを抽出し、このテキストデータを設定されたキーワードと比較照合し、該キーワードと一致するテキストデータが存在した場合には、WWWブラウザに対しエラーを通知するなどして表示を制限することを特徴とする。
(57)【特許請求の範囲】
【請求項1】表示ページのHTML(ハイパーテキストマークアップ言語)データ内のテキストデータを抽出し、このテキストデータを、設定されたキーワードと比較照合し、該キーワードと一致するテキストデータが存在した場合には、WWWブラウザに対しエラーを通知して表示を制限することを特徴とするWWWブラウザ表示ページ制御方法。
【請求項2】WWWブラウザにページ内容のHTMLデータが表示される前に、前記HTMLデータを取り込み、テキストデータを抽出する手段と、データの表示を制限するために定義されるキーワードを入力する手段と、前記キーワードをHTMLデータ内のテキストデータと比較照合する手段と、前記キーワードと一致したデータが存在した場合には前記WWWブラウザにエラーを通知し、一致しなかった場合には取り込んだ前記HTMLデータを前記WWWブラウザに供給する手段と、を備えたことを特徴とするWWWブラウザ表示ページ制御方式。

キーワードマッチングによってWebコンテンツをブラウザでフィルタリングしようという特許。
まんまですね…
明細書の内容も短く、非常に読みやすいですし、何がしたいのか一発でわかる特許です。
ちょっと気になるのは、

【0022】ここでは、インターネットプロバイダ(IP)には、mesh(NECのインターネット接続サービス)101、WWWブラウザにはNetscape102を使用するものとする。

これって、特許で言うところの「公序良俗違反の表示」になるような気がするんですが…今は亡きネットスケープというところが懐かしい。この発明だと辞書はPC内にあるようだが、この辞書はネット経由で他のサーバに接続して利用するとか、ファイヤーウォールに仕込むとかイロイロ回避方法はありそうな気がする。ちなみに、この特許が切れるのは2016年7月19日になります。

話し戻って、思うに、キーワードのハッシュコードか何かを辞書登録した「有害単語定義サイト」を何種類か立てて、そこにWebブラウザが単語から抽出されたハッシュコードを問い合わせると「有害度数」が返信されて、その「有害度合いの総計」に応じてブラウザで表示制限を欠けるような仕組みが構築されればいいんではないかと…で、利用者は任意の「有害単語定義サイト」を選べるようにしておけるようにしておけばいいのではないかと、思ったり、思わなかったり。