サイトTOPに戻る

自然言語解析

クローラーで収集する情報の大半は何らかのメタデータに変換します。そのための解析技術があります。単に日本語を解析するだけではなく、最も重要となるメタ情報を取得することを強みとしています。

日付情報

フリーワードテキストに含まれる日付情報を、日付型に変換いたします。

例) 火曜日 → 文脈から次の火曜日と判断 2/12 → 文脈から過去か未来かを判断して年の情報を付与

これらを使い、公式・非公式の情報をクロールし、ゲームのイベント情報を整理サービスに役立っています。

サイズ情報

ファッションECでは、アイテムに対するサイズ情報は、S,M,Lなどで表記されますが、各ブランドごとに、それぞれの実寸サイズは別欄に表記があります。この表記はフリーワードで記載されれるため、B90だったり、 バスト90.0などの表記のブレがあります。これらの文脈を判断して表記方法が違うHTMLから同じようにサイズ情報を整理し、サイト横断でサイズ情報を取得することができています。


お問合せは以下のメールアドレスから

contact@rooter.co.jp