カテゴリー : データ/フォーマット
こんにちは。アルバイトのkondoです。 クローリングで集めたデータの調査で、SQLを使いデータベースへ問い合わせをすることがあります。 今回はクエリの中でも少し難し目の参照系のクエリ(GROUP BY句, JOIN句, […]
こんにちは。rooterエンジニアのohkabeです。 弊社はクローリング会社ですが、集めたデータについての分析も同様に重要な業務となっており、データコンサルティングサービスも提供しております。 今日はそんなデータ分析を […]
awk アルバイトのMoriです。 今回は業務で触れる機会があり、プライベートでも使い始めた言語AWKについて書かせていただきました。 目次 なにを紹介するのか 1. 最後からn番目の列を出力する 2. ファイルの2行目 […]
初めまして、ルーターの学生アルバイトのhashimotoです。 9月中旬からルーターに入り、研修を終えて、少しずつ業務をさせていただいています。 今回は、その中で最初にやらせていただいた、マルコフ連鎖を用いた文章自動生成 […]
こんにちは。ルーターの学生アルバイトのkondoです。 作成したプログラムの動作を保証する仕組みとして、テストコードを書くことがあります。 今回は、Rubyでのテストコードの書き方について紹介します。 テストコードとは […]
日本シリーズ開幕!! こんにちは!ルーターエンジニアのohkabeです。 日本シリーズが開幕しました。前回に引き続き野球のデータをjupyter notebookでビジュアライズします。 下準備 以下のモジュールを使用し […]
jupyter notebookで野球データをビジュアライズ part 1 クライマックスシリーズ突入!! こんにちは!ルーターエンジニアのohkabeです。今回はクライマックスシリーズ突入という事で、野球のデータをju […]
学生エンジニアのMoriです。 今回は 形態素解析ツールの一つMecabのIPADICにユーザー辞書を追加する方法について書きたいと思います。 目次 Mecabの形態素解析の仕組みの簡単な説明 CSVの作成 辞書ファイル […]
こんにちは。エンジニアのAraoです。今回は、NokogiriでHTMLをパースするときに、深さ優先探索を実施する方法を紹介します。 何故深さ優先探索か Webスクレイピングの際に、対象となるHTMLがどのような形式か事 […]
はじめまして、ルーターのKIMです。 プログラミング、特にデータ系のプログラムを作るときはいろんな形の出会えます。 Rubyでは基本的に「文字列」や「数字」以外にも「配列(Array)」とか「ハッシュ(Hash)」などい […]
お問い合わせ・ご依頼はこちらから