NEWS
お知らせ
オープンデータ統合に関する弊社の取り組み
オープンデータ統合とは
オープンデータ統合とは、個別のサービスがインターネット上に公開しているデータを統合して幅広く活用できるようにする手法です。事業体ごとに異なるシステムやコード体系を利用しているケースではデータのフォーマットが違うためスムーズに連携できません。データを活用するには、インターネット上に分散しているデータ集めた上でコード体系を含めて統合することが重要です。
【活用事例1】企業データベースの統合
プレスリリース、広告出稿、会社ホームページなど企業が発信するデータを横断して分析したいケースがあります。その際に同一の企業かどうかを判別するために企業名の名寄せを行います。
弊社では各データベースの法人名に対し国税庁が提供する法人番号データベースを照らし合わせ、すべて法人番号を付与することで、各データベースの法人情報を名寄せいたします。法人番号データベースを使用することで、社名の旧字・縮退文字対応や社名変更、吸収合併なども追随することが可能になります。
また、弊社のクローラー技術を使うことで会社のホームページを探して連携することも可能です。法人番号データベースには記載されてない事業内容や代表取締役の情報を非上場企業に関しても会社概要ページから自動抽出できております。
法人番号を付与することで、国が提供するデータベースとの統合も容易になります。
例)- J-PlatPatとの連携で法人がもつ特許情報を統合
- 厚生年金保険・健康保険データベースとの連携で法人が厚生年金保険に加入した年月日や被保険者数を取得することで、その会社の正社員数を推定
ECサイト上ではストアとして会社が登録されており、プライバシーポリシーや特商法表記などをクローリングすることで社名を名寄しています。ECサイト上のレビュー数や商品単価からECサイト上での売上推定など、企業活動の推移を予測するのに役立ちます。
また、弊社が提供する広告クリエイティブデータベースサービス「アドクロール」に関しても、広告出向主の主要3000社を正式社名に名寄せしております。どの会社がどのブランド名でどの媒体に出稿しているかという情報の精度がより上がります。
【活用事例2】宿泊施設名の統合
各種旅行サイトで提供されている価格情報などサイトを横断して情報比較をしたいケースがあります。弊社では自社のクローリング技術を使い、各サイトでのホテル名を検索し提供されてる情報の類似度をスコアリングしたホテル名データベースを作成します。住所に関しては表記されている住所とMap表示されている緯度経度の情報の両方を活用し、同じ施設かどうかを判定してホテル名の名寄せを行っております。
複数のサイトでホテル名の名寄せを行うことで、ホテル名の表記ブレのデータベースを作成することができるため、新たなサイトを名寄せする場合の精度があがります。
機械的に判定が難しいものは手動でのチェックを行うケースもありますが、クローリング技術をあわせた校正画面を運用しているため効率のよいチェック体制も構築可能です。
株式会社ルーターは、自社の強みであるデータアグリゲーション技術を活かし、オープンデータ統合を進めることで分散されたデータを再利用しやすい形へと再構築いたします。
CONTACT
お問い合わせ・ご依頼はこちらから