実装編アーカイブ

2021-06-23

LAPRASポートフォリオタグの分類実験とパイプライン設計

はじめにこんにちは、LAPRASのAILABチームです。今回は池・田嶋・森元で、LAPRASポートフォリオのタグをエンジニア関連のタグ(エンジニアタグ)とそうでないタグ(非エンジニアタグ)に分類する分類器を検討してみました。ここではその実験の詳細と、また再現性のある方法で分類器を得るためのパイプラインについて検討した内容をまとめます。タグ分類現在のLAPRASポートフォリオ上では図のようにユ …

“LAPRASポートフォリオタグの分類実験とパイプライン設計” の続きを読む

2018-02-05

Poincaré Embeddings による職種の類似度計算とその利用

scouty アルゴリズムエンジニアの高濱です。外部への情報発信はこの記事が最初なのでこの場を借りて自己紹介させていただきますが、私は scouty 代表の島田、リードエンジニアの伊藤と京都大学工学部情報学科での同期で、京都大学大学院情報学研究科鹿島研究室で修士課程を修了した後、株式会社リクルートホールディングスを経て scouty に入社しました。代表的な著作物は [Takahama et al …

“Poincaré Embeddings による職種の類似度計算とその利用” の続きを読む

2017-11-27

RNNで言語モデルを作る – 実装編

代表の島田です。前回の記事 RNNで言語モデルを作るための理論では、言語モデルを作るという目的で一般的なRNNの構造についての解説を行いました。それを踏まえて、今回の記事では Python で実際に言語モデルを実装し、その言語モデルを用いて自動で生成された文章の内容を確認してみます。 scoutyでもRNNは今後文生成や、スカウトメールの文面と返信率の相関性検証などに使っていこうと考えている技術 …

“RNNで言語モデルを作る – 実装編” の続きを読む

2017-08-23

トピックモデルで単語の分散表現 – 実装編

scouty代表の島田です。前回の記事トピックモデルで単語の分散表現 – 理論編では、トピックモデル・LDA（Latent Dirichlet Allocation）の基本構造とアイディアを、非エンジニアにも比較的わかりやすく説明しました。今回はPythonで実際にトピックモデルを使って単語の分散（ベクトル）表現を作ってみます。エンジニア向けの記事ですが、最後の性能比較の部分はエンジニアで …

“トピックモデルで単語の分散表現 – 実装編” の続きを読む