ピアソン相関係数とk-means法を使って嗜好の似ている人を特定するプログラムをpythonでやりたい

映画サイトとかでレビューってあるじゃない? あれのユーザーごとのレビューの評価データを集めて、自分と似てる人にオススメの映画紹介して欲しくない? それをpythonでやれたら素敵じゃない? という事でpythonでピアソン相関係数を用いて類似度を計算し、自分と似てる人を特定するというプログラムを作ってみた。

“ピアソン相関係数とk-means法を使って嗜好の似ている人を特定するプログラムをpythonでやりたい” の続きを読む

教えたURLを学習して覚えた知識で喋るようになるbotを作成する

最近機械学習が熱い。会社の仕事が谷中の谷なので好き勝手自分の特許書いたり興味のあることなりを調べているのだが、ひょんなことから後輩にもらった集合値プログラミングの本を読んでたら感動した。

amazonのオススメの商品を推薦するアルゴリズムを基本として、分かりやすく機械学習の手法が説明されている。僕のない頭でも実際にプログラミングしてコンピュータに学習させ、推薦の〇〇を出すことができた。予想以上にのめり込み、多分情報系の学部3年生ぐらいの知識は得ることができた。ということで目下、ホームページを見せるとその内容を学習し、それに基づいた思想で喋るTwitter bot作成中である。

“教えたURLを学習して覚えた知識で喋るようになるbotを作成する” の続きを読む

社内ニートと職務経歴書

 完全に仕事がなく、社内ニートになりつつある。こう、一緒に仕事してた先輩が課長などに会議室に呼ばれていろいろ話しているのを見ると、「え? 先輩には仕事があるのに俺にはない?」みたいな不安感に苛まれやばいです。あいつ、仕事もらったのか。。。! みたいなせめぎ合い。まあ多分そんなことは数日のことでいずれ無茶振りが飛んでくるのでそれまでべんきょべんきょでスタンバります。
 んで、日中は特許書いてた。機械学習系の特許でベクトルでいろいろ分析するやつ。レビューはあっさり通ったがこう言う学術系の特許はきちんと書かないと誰もわからないという理由でリジェクトされる場合が多い。そのためベクトルの基礎から例を交えて説明。ちゃんとわかる資料になったつもりだが、さらに上司に承認を得るにはもう少しハードルがある。おそらくベクトルとか25年ぶりとかそういう人たちにベクトルを説明せねばならないのだ。大変である。
 帰宅後は茶太郎の世話やら家事やら。あと転職用に職務経歴書などを書いていたが、なんか英語版もかけって言われててめんどい。日本語書いた時点で集中力が切れた。明日はこれを英語化する。なんか高校の時の英作文の宿題みたいでちょっと楽しいよね。英語好きなんだわ俺。

コーディングテストに備える

 転職にいい案件があったので気になっているって前言ったと思うけど、コーディングテストがあるので不安視していた。コーディングテストって何やんのってエージェントに聞いたところ、C++の基礎的なところと伺っておりますとの回答。それは果たしてポインタが使えればいいのか、クラスが作れればいいのか、はたまたQtでUI出せればいいのか、野良ライブラリをググって使いこなせればいいのか。全然レベル感が違う。果たして地味に一番難しいのはポインタの扱いで、そんじょそこらのライブラリをなんとなく使ってはいるが、ポインタとか正直わからないっていう人結構いると思う。俺もその類だ。文句あるか。
 コーディングテストというのがどのレベルか判然としないため、一番苦手な基礎的なところを復習することに。ひとまずポインタといえばリスト構造でしょう。ということでリスト構造をC++で作り、挿入、参照、削除をする機能を実装する。が削除がうまく行かない。うんうん唸って、家に帰って笑ってこらえて見ながらひたすらコードとにらめっこしてああでもないこうでもない。めちゃめちゃ試行錯誤してひとまずできた。なんか関数の再帰呼び出しとかしてるけど。全然単純じゃないけど。これをコーディングテストで出したら失格かな? 簡単なことを複雑にしか書けない。これが俺のレベル。ひとまずポインタ云々はいろいろ復習できたのでエージェントに面談お願いって回答しよ。リスト構造をスクラッチで書く必要ないもの。ライブラリ使うわ。ようはメモリの確保や解放のタイミングがわかって、ライブラリがググって使いこなせればいいんだよハゲが。