カテゴリー : データ/フォーマット
初めまして。12月からrooterの学生アルバイトとして働いておりますmiyayamaと申します。今回は、研修の中で学んだRubyのCSVモジュールの使い方について書きたいと思います。 Ruby標準添付ライブラリーである […]
CSVファイルにはRFC4180という標準仕様があるのですが、やや広い定義となっています。 「RFC4180にしたがったCSVでやりましょう」だけではフォーマットが決まらないので、決めるポイントとおすすめ設定を紹介します […]
こんにちは、アルバイトのkoyamaです。 Googleスプレッドシートの内容をRubyのプログラム上で扱う時みなさんはどうしているでしょうか? 以前私が紹介したgem、google-drive([入門編] Rubyから […]
ルーターの伊崎です。今回は、弊社で実際に行っている、BERTによるYouTubeの広告分類についてお話いたします。 はじめに 弊社では、YouTubeの動画広告のスクレイピングを行っており、そこで得られたデータは弊社の広 […]
はじめまして、ルーターのアズマインと申します。今日は漢文系言語 x 形態素解析についてご紹介したいと思います。 形態素解析とは 機械学習で文章を扱うとき形態素解析は欠かせない作業です。コンピューターは数字しか扱えないため […]
こんにちは。学生アルバイトのohkiです。みなさん、テーブル構造というとどんなものを思い浮かべるでしょうか?おそらく多くの方が横持ち構造を思い浮かべるのではないかと思います。確かに横持ち構造の方が見やすいですが、縦持ち構 […]
こんにちは。学生アルバイトのohkiです。最近データを扱うということでは、生成したcsvファイルの差分を確認したいということがよくあります。テキストの差分を比較するツールは世の中たくさんありますが、それを用いてしまうと行 […]
こんにちは!ルーターの伊崎です。 今回は、データの効率的な消し方と、SQLの機能であるストアドプロシージャをご紹介します。なお、今回データベースをMySQLとしていますが、細かい書き方は違えどデータベースの種類によらずに […]
はじめに こんにちは。アルバイトの近藤です。 突然ですが、HTMLからテーブルをパースしたいとき、どうしますか? そうです、HTMLパーサーを使いましょう。 RubyならNokogiriが、PythonならBeautif […]
こんにちは。学生アルバイトのohkiです。皆さんはシェルで数値計算をしたことがありますか?シェルでは、他のプログラミング言語と同じように四則演算は簡単に行うことができます。しかし、小数点以下が存在するなど、少し複雑な計算 […]
お問い合わせ・ご依頼はこちらから