機械学習をマスターするための厳選記事まとめ【2020/3/5 更新】

AIを作って稼ぐ
ワタシナガタ

データサイエンス・機械学習・深層学習の研究者(修士)ですが、Pythonで開発したAIから得られる不労所得で生きてます。本サイトは【未経験でもAIを開発】を手助けします。

>>管理人プロフィール・理念はこちら<<

ワタシナガタをフォローする

機械学習とか何も知らない人が読むべき記事をまとめました。

「機械学習とかディープラーニングって何?」って人でもこれらの記事さえ読めば「機械学習ってつまり〜だよね」って友達に説明できるようになります。

少し難しい記事も含まれていますが、難しいと感じたら読み飛ばしても全然支障はないです。

記事は今後も追記していくのでたまに確認してください。【2020/3/5 更新】

・機械学習

MATLABで始めるディープラーニング

MATLABで始めるディープラーニング
ディープラーニングの基礎を学ぼう。ディープニューラルネットワークの学習方法を知る、学習済みネットワークを使いこなす、簡単な画像分類の例を見る。ebookをダウンロード。

「そもそもディープラーニングって何?」って人におすすめです.ディーラーニングの基礎から学べます。

特異値分解(SVD)と多次元解析

http://elsur.jpn.org/reading_notes/Greenacre1984.pdf

機械学習を行う上で必須となる「主成分分析」の理解の助けとなる資料です。正確にはサイトではないのですが、ネットに落ちているPDFでとても役立ちます。

Leakage in Data Mining

https://takuti.me/ja/note/leakage/

直訳すると「データマイニングの漏れ」。データを扱う上で意図せず不当にデータを使ってしまう等、データマイニングにおいて多く起きるミスがまとめられている。

統計的因果推論とデータ解析

データ解析を用いて因果推論を行う際の注意点がまとめられている。

深層学習の原理を明らかにする理論の試み

https://www.ism.ac.jp/openhouse/2019/index/ISM-75-tutorial-imaizumi.pdf

「中身はブラックボックスになっている」と言われて久しい深層学習ですが,そのほかにも多くの謎が深層学習にはあります。それらをわかりやすく纏めたスライドです。

機械学習の課題:最適な分類モデルの選択と過学習の回避

機械学習の課題:最適な分類モデルの選択と過学習の回避
ホワイトペーパーをダウンロード 機械学習: 最適な分類モデルの選択と過学習の回避 MATLAB 分類学習器アプリ、正則化、交差検定の実行などを解説。

適切なモデルを選ぶコツが書かれています。「なぜこのモデルの精度が高いのか」の説明のヒントにしてください。

言語学の正解でも統計と機械学習という2つの文化が対立

言語学の世界でも統計と機械学習という2つの文化が対立 - Qiita
機械学習と統計学、予測と因果など、これまでにもこうした違いについて何回か取り上げてきました。 実は言語学、自然言語の研究分野でもこうした違いに関しての論争があります。その中でも有名なのは、近代の言語学の父とも言われるノーム・チョ...

一口にデータサイエンティストといっても、統計出身なのか工学出身なのかで考え方は人それそれです。文化の違いがあるということを知っていないと他の人の記事読んだ時や講演を聞いた時に、意図を間違えて理解してしまいます。

全てのプログラマーあるいはデータサイエンティストが身につけるべきソフトスキル

すべてのプログラマーあるいはデータサイエンティストが身につけるべきソフトスキル | AI専門ニュースメディア AINOW
AINOW翻訳記事「すべてのプログラマーあるいはデータサイエンティストが身につけるべきソフトスキル」では、技術者が身につけるべき非技術的なスキルが詳細に解説されています。技術をわかりやすく説明したり困難な状況で創意工夫するソフトスキルは技術者のキャリア形成に役立つものであり、日々の心がけで鍛錬できるものなのです。

機械学習とは直接関係ありませんが、機械学習を用いたビジネスや研究を行う上で必要な心構え的なものが学べます。

楠正憲に聞く「ビジネスと倫理観」.企業の考える“正しさ”はなぜ炎上するのか

楠正憲に聞く「ビジネスと倫理観」。企業の考える“正しさ”はなぜ炎上するのか? 3つの対策 | iXキャリアコンパス
大手SNSや就職サイトの運営会社がユーザー情報を第三者に提供していたことでネット上での炎上を招くなど、良かれと思って考案したビジネスが、時として社会規範に反する結果になってしまうことがあります。それはなぜか。そうしたリスクを未然に防ぐ手立てはあるのでしょうか。これまで内閣官房補佐官としてマイナンバー制度を支える情報シス

HRなどに機械学習を用いた時に生じる問題さについて。

異常なほど住民が早死にする街「グラスゴー」は一体なぜ生まれてしまったのか?

異常なほど住民が早死にする街「グラスゴー」は一体なぜ生まれてしまったのか?
スコットランドにある都市グラスゴーは、かつて造船業で栄え、ロンドンに次ぐ大英帝国第2の都市と呼ばれていました。しかし、近年では住民の健康度が低く、イギリスの他の都市やヨーロッパの各地に比べ異様に平均寿命が短いことから「ヨーロッパの病人」と呼ばれており、この現象は「グラスゴー効果」として知られています。医学や健康問題を中

いわゆる「グラスゴー問題」について.意図しないデータのバイアスがなぜ生まれるのかのヒントになります。

人間が深層学習のAIを理解できないのには、理由がある。

人間が深層学習のAIを理解できないのには、理由がある:朝日新聞GLOBE+
「『予測』という名の欲望」連続インタビュー#7(完) 今泉允聡・統計数理研究所助教囲碁の世界チャンピオンを破ったソフト「アルファ碁」などで一躍注目を浴びるようになったのが、人工知能(AI)の「ディープラーニング」(深層学習)という技術...

「なぜ深層学習は人間には理解できないの?_」と聞かれたらこの記事を読Sませましょう。

SHAPでモデルの予測結果を説明する

SHAPでモデルの予測結果を説明する
こんにちは、エンジニアのtetsuです。 どうしてモデルがこのような予測をしたのか、ということを説明することの…

機械学習モデルを解釈する指標SHAPについて.ブラックボックスといわれる機械学習の説明に役立ちます。

Apple Cardに発覚した“性差別”問題から,「性別を見ないアルゴリズム」に潜むリスクが浮き彫りに

Apple Cardに発覚した“性差別”問題から、「性別を見ないアルゴリズム」に潜むリスクが浮き彫りに|WIRED.jp
アップルが米国でサーヴィスを開始したクレジットカード「Apple Card」が

「男女差別をなしたい」っていう目的のためには単に「性別を見ない」だけじゃだめだよ,って話。本データに含まれるバイアスは簡単には取り除けない。

機械学習の問題点

現状の機械学習の問題点について。

個人情報含むデータは,AI&機械学習に使えるのか?〜個人情報保護法〜

個人情報を含むデータは、AI&機械学習に使えるのか?〜個人情報保護法〜 ― DLLAB勉強会
AI/機械学習のデータには、例えば診察情報/店頭映像/ネットコンテンツ抽出など「個人情報」や「個人の権利」が含まれる場合がある。「日本の個人情報保護法の下では、個人情報を含むデータはどう扱えばよいか?」を説明する。

機械学習で生データを用いているとぶち当たる「個人情報」という壁。ある程度個人情報保護法を知っていれば、少しはやりやすくなるはず。

データデータデータデータデータって聞き飽きたのでなんとかしたい

データデータデータデータデータデータって聞き飽きたのでなんとかしたい|松本健太郎|note
数ヶ月ほど前、東京都内某所で開催された飲み会での出来事です。 横に座ったオッサンに職業を問われたので「データサイエンスを少し」と答えたら、大げさに「凄いねぇ!」と返され、羨ましそうに言われました。 「データサイエンティストなら、色んなデータ集めて、タピオカの次に何が流行るか分かるでしょ! いーねぇ、楽できて! 稼

データって別に別になんでもわかるわけじゃないよって話。データは事実であって真実ではない。

AIブームは熱狂から平穏へ?19年のAI業界から未来を占う

AIブームは熱狂から平静へ? 19年のAI業界から未来を占う
AI業界の事情に詳しいマスクド・アナライズさんが、2019年のAI業界を振り返る。

僕の実感でも採用より「育成」ってのは常々感じています.ドメイン知識がないとデータだけ見ても何もできない。

黒人の医療ニーズを低く見積もるアルゴリズム,その原因は「現実世界の不平等」にあった

黒人の医療ニーズを低く見積もるアルゴリズム、その原因は「現実世界の不平等」にあった|WIRED.jp
とある大規模医療機関で使われていた医療用アルゴリズムで、黒人の医療ニーズを低く見積もるバイアスが見つかった。健康リスクの判断材料に

ピュアデータをそのまま入れるとうまくいかない時もあるよねって話。

名前空間 -Wikipedia

名前空間 - Wikipedia

機械学習のコードは長文になることが多々あります。そうすると「hako」みたいな適当な変数名を使っていると、確実にバッティングします。必ずユニークなキーをつける必要があるのですが、それに関連した概念として「名前空間」というものがあります。コードを書いた経験がある人は知っておくべきです。

AIの利活用をめぐる問題

AIの倫理について

・資料作成

伝わるデザイン

伝わるデザイン|研究発表のユニバーサルデザイン
情報の伝わりやすさは「資料の作り方」に大きく左右されます。本ページでは、プレゼン資料などを作るためのデザインルールやテクニックを紹介します。

機械学習を学ぶと、全く機械学習を知らない人に「機械学習とはなんぞや」と説明する機会が多いです。とりあえずここに載ってることは押さえときましょう。

科学者が小説家から学んだ「よりよい科学論文を書くいろは」を学術論文紙のNatureが紹介

科学者が小説家から学んだ「よりよい科学論文を書くいろは」を学術論文雑誌のNatureが紹介
どれほど卓越した研究者が行った偉大な研究でも、論文として正確に伝えられなければその研究をアピールできません。そんな「素晴らしい科学論文を書く方法」を、「科学者が小説家から受けたアドバイス」という形で学術論文雑誌Natureが掲載しています。

理系だからこそ、文章の書き方は文系に学びましょう。

スライドの文字や画像,安易に大きくするのはNG! 読みやすさを格段にアップするデザイナーのバランス術

スライドの文字や画像、安易に大きくするのはNG! 読みやすさを格段にアップするデザイナーのバランス術

ちょっとしたコツで資料は格段に見やすくなります。

・就職、転職

Wantedlyお兄ちゃん@会社立ち上げました/複業家/Voicyパーソナリティ/人事(@Bashiiiiii0603)さん | Twitter
Wantedlyお兄ちゃん@会社立ち上げました/複業家/Voicyパーソナリティ/人事 (@Bashiiiiii0603)さんの最新ツイート 副業で人材紹介会社立ち上げ/Voicy(/LINEで就活転職相談/採用オウンドメディア/#21卒 採用中/MTRL掲載/新卒1年目副業10社で日経、bizSPA、週刊SPA、マツ

NTT。

「20代で年収1000万」を狙えるIT企業はどこ?

「20代で年収1000万円」を狙えるIT企業はどこ?
「Openwork」運営元が、口コミに基づく「20代で年収1000万円を狙える企業」の一覧を発表した。IT業界では、外資系企業やベンチャー、ITコンサルなどが該当した。他業界では、キーエンスや5大商社が含まれた。

年収だけ見たらメーカーはクソ。

世界中の工学/IT専攻の学生にとって、最も魅力的な就職先トップ40 [2019年版]

世界中の工学/IT専攻の学生にとって、最も魅力的な就職先トップ40 [2019年版]
最新調査によると、世界各地の工学やITを専攻する学生たちは、大手のテクノロジーや工業生産、自動車メーカーで働きたいと考えている。企業ブランディング...

いわゆる機械学習を学んだ人たちが就職したい会社.日本のメーカ、特に電機とかほとんど入っていませんね。一昔前はパナソニックとかシャープとか入っていたらしいですけど。

・英語学習

Chome拡張機能の高速な英語辞書ツールを作りました(Mouse Dictionary)

Chrome拡張の高速な英語辞書ツールをつくりました(Mouse Dictionary) - Qiita
Mouse Dictionary Chrome拡張の高速な英語辞書ツールです。 ダウンロード: - Chrome版 - Firefox版 (設定変更未サポート) とりわけ、ブラウザでよく技術文書を読む人(含自分)に最適かと思...

機械学習を勉強してると英語の記事を読むことも多くあるので,英語の学習効率はあげましょう。

Google,単語の発音練習ができる新機能

Google、単語の発音練習ができる新機能
Googleは14日、単語を検索すると正しい発音の発声練習などが出来る新機能を、アメリカ英語を対象に公開した。Google検索により言葉の意味をより理解できるようにする取り組みで、言葉の発音方法の練習や、画像を表示することによって言葉を正しく理解できるようにする。

便利な世の中になりましたね。

Therefore の使い方に要注意!

Therefore の使い方に要注意!|英語いろいろブログ
英語学習メモ

論文とか書くときに要注意。

【無料】Grammarly (グラマリー)の使い方徹底解説!英文・文法添削ツール

【無料】Grammarly (グラマリー)の使い方徹底解説!英文・文法添削ツール | There is no Magic!!
Eメール、エッセイ、レポートの英文添削に「Grammarly(グラマリー)」。スペリング、文法ミスの校正を無料で。Grammarlyの使い方を徹底解説。今すぐ「無料」で始めよう!

英語で文を書くときはまずGrammarltyを使いましょう。これだけで読みやすい英語になる分けではないですが、悲惨な英語は避けることができるはずです。

「a」「an」「the」の違いと使い分け!無冠詞になる条件は?

「a」「an」「the」の違いと使い分け!無冠詞になる条件は?
冠詞「a」「an」「the」の違いはしっかり理解していますか?日本語では訳しづらいのもあり、使い分けが正しくできない人が多いようです。そこで本記事では冠詞「a」「an」「the」の意味と使い方を徹底解説していきます!

冠詞は日本人にとって一番難しいです。最低限のルールは守らないと論外にせよ、最後はネイティブのチェックで修正しないと完璧にはなりません。正直なんで直されたのかわかんないことも多いです。とりあえず最低限のルールは知りましょう。