ニフティ、スパムブログの自動判別技術を開発

ニフティ、スパムブログの自動判別技術を開発。国内ブログの4割がスパムという記事より。

今回発表した技術は、ニフティの研究機関であるニフティ研究所が開発したもので、アフィリエイトの広告収入を得ることや、特定のWebサイトへ誘導することを目的として作成されたブログを、複数のフィルタリング技術を組み合わせることでフィルタリングできるという。

ニフティが、スパムブログを自動判別することができるフィルタリンク技術を開発したことを発表しています。

スパムブログに関して、以下の3つに分類しています。

・他ブログや検索結果を自動的に引用する「引用スパム」
・アフィリエイトを自動掲載する「アフィリエイトスパム」
・文章を自動生成するワードサラダを「自動生成系」
・わいせつな記事や出会い系の「アダルト系」

最近は特に自動生成系の勢いが強くて、検索結果を見ただけだと、それがスパムなのかどうか分からない、ということもありました。

今回のフィルタリンク技術を用いると、

2007年10月は39.3%、2007年11月が40.1%、2007年12月が39.7%、2008年1月が39.9%、2008年2月が40.5%

ということで「国内の約9割強に相当するとする4.5億件のブログ記事」の内、約4割がスパムブログだったと判定されたそうです。

Googleブログ検索も最近、けっこうスパムブログが排除されつつあるような気がしているのですが、どうでしょうか。