
カテゴリー: Python


Pythoner / PythonistaがRubyを始める前に受けておきたい予防接種
ともに最初の登場からは20年以上経ち、特にそれぞれ機械学習、Ruby on Railsなどの影響で利用されることの多くなったPythonとRuby。プログラミング学習と言えばCからと私などは思ってしまいますが、その敷居の […]
YouTubeの限定公開動画広告をBERTで分類する
ルーターの伊崎です。今回は、弊社で実際に行っている、BERTによるYouTubeの広告分類についてお話いたします。 はじめに 弊社では、YouTubeの動画広告のスクレイピングを行っており、そこで得られたデータは弊社の広 […]
MacでTesseract OCRを使って画像内のテキストを取り出してみる
こんにちは、アルバイトの上野です。今回はOCRを使って画像中のテキストを文字として取り出すtesseractというオープンソースについて紹介します。 インストール まずはbrewでインストールします $ brew ins […]
PDFに埋め込まれたテーブルを、画像処理でパースする
はじめに こんにちは。アルバイトの近藤です。 突然ですが、HTMLからテーブルをパースしたいとき、どうしますか? そうです、HTMLパーサーを使いましょう。 RubyならNokogiriが、PythonならBeautif […]
mitmproxyによるHTTP通信情報収集時に、リクエスト情報で対象の通信を判別する方法
こんにちは。学生アルバイトの橋本です。今回は, 以前の記事でご紹介した, mitmproxyで通信内容を自動取得する方法の発展として, request時のpostパラメータなどを用いる方法をご紹介します。 本編 mitm […]