クローリング/スクレイピング – 株式会社ルーター

MAGAZINE

カテゴリー : クローリング/スクレイピング

AI／機械学習

2026.07.28

Chrome DevTools MCP実践：SPA, SSRサイトでもAPIエンドポイントを1分で特定してクローラー開発

はじめにクローリング・スクレイピング案件を専門とする弊社では、「調査フェーズ」が開発全体のボトルネックになりがちです。具体的には、DevToolsのNetworkタブを開きながら「このXHRリクエストが欲しいデータを返 […]
JavaScript/Node.js

2026.01.22

【GAS】Gmailの内容をスプシに自動転記する（特定メールの抽出方法）

はじめにこんにちは。エンジニアのmiyakawaです。業務の中では毎日たくさんのEメールが受信されます。 Eメールを受信していくうちに過去に届いたメールは重要なラベルを付けていたとしても、2年前や3年前のメールを全て […]
クローリング/スクレイピング

2025.12.16

chrome_remoteのRuntime.evaluateを用い、ブラウザ上でJavaScriptを評価してテキストを取得する

皆さん、こんにちは。エンジニアのHatanoです。ブラウザ自動操縦でHTMLから特定のテキストを取得する際、クロールしたHTMLに対しNokogiriなどを使ってRubyで扱えるようにパースを行い、そこからCSSセレク […]
クローリング/スクレイピング

2025.11.14

スクレイピングエンジニアが使うChrome拡張機能の紹介

スクレイピングエンジニア8年目のitogaです。今回は、私がスクレイピング、クローラーを実装するにあたって活用しているChrome拡張機能を4つ紹介します。 1. JavaScriptのON,OFFをするChrome拡 […]
クローリング/スクレイピング

2025.10.21

ぽこぽこ界隈のブランドを集計をしてみた

yugoyamamotoです。「ぽこぽこ界隈」というSNS動画界隈があります。界隈といいますが実際にはそういう動画編集フォーマットです。動画あたりの商品紹介の密度という点ではすばらしい発明です。教養として把握しておくべ […]
クローリング/スクレイピング

2025.10.17

決算書のPDF内部の表をAIに読み取らせてみた

はじめにこんにちは、エンジニアのmiyakawaです。ビッグデータとよく聞きますが、いまだに表に記載されているデータがPDFの中にあるということは珍しくありません。 PDF内に記載されている表が1つくらいなら手作業で […]
クローリング/スクレイピング

2025.10.10

コマンドライン上で2要素認証のコードを取得しログインを自動化する

はじめに近年、国内でも不正アクセスによる事件が相次ぎ、私たちが利用している多くのサービスで「二段階認証」の導入がほぼ必須となっています。その中でも代表的なのが、Google Authenticatorを使ったワンタイ […]
クローリング/スクレイピング

2025.08.01

PDFスクレイピング手法全公開

PDFでのデータ公開が止まらない yugoyamamotoです。文書のパーマリンクを共有しておけばリアルタイムに最新版が見れて便利だよねというのがインターネットの便利さではあるのですが、一向にPDFを添付しあうという文 […]
クローリング/スクレイピング

2025.05.09

UTF8の絵文字を削除する方法

UTF8には3種類ある UTF8と一言で言っても業務上は3つの分岐が発生します BOMなしUTF8 一般的なUTF8ですね BOMありUTF8 「CSV拡張子のファイルをダブルクリックしてエクセルで文字化けせずに開かせた […]
クローリング/スクレイピング

2025.05.02

RubyのNokogiriで子要素のみのテキストを取得し兄弟要素から指定する

Nokogiriのtextメソッドは子孫要素まで結合されて困る RubyのNokogiriでHTMLをスクレイピングするとほぼ必ず使うメソッド「text」は、子孫要素全てのテキストを結合して取得する仕様となっています。そ […]

CONTACT

お問い合わせ・ご依頼はこちらから