2020年12月18日
画像認識系のノンプログラミング機械学習サービス Lobe を利用する
Lobeは画像認識系の機械学習をノンプログラミングで行えるサービス (紹介記事はこちら)
今回 Lobeの出力モデルを用いて、フォルダ内に格納されている全ての画像に対して推論を行うスクリプトを作成した。
[1] Lobe の Local API で推論を連続実行するスクリプト
[2] Lobe の TensorFlow モデルで推論を連続実行するスクリプト
[3] 上記スクリプトの実行結果から混同行列(Confusion Matrix)を作成するスクリプト
posted by Takashi Inoue at 21:30| Comment(0)
| メモ
2020年07月11日
Excelの乱数出力はどの程度ランダムか

Excelの乱数出力(RAND関数)について、ヒストグラムを作成してランダム性を確認した。
RAND関数は 0〜1.0 の値を値をランダムに返す。
RAND関数の出力結果を等幅 10 区間で集計する場合 (0.0〜0.1, 0.1〜0.2, 0.2〜0.3, ...)、1000回以上の試行を行えば、各区間の出現確率にバラツキがなくなるという結果が得られた (各区間が 真値±1% 程度に収まる)。
回帰式の当てはまりが良いため(決定係数0.9897)、「試行回数のルートをとって4で割る」をバラツキの目安としても良いかもしれない。集計区間数に関する依存性は、変数を試行回数ではなく試行回数/等幅集計区間数とすることで表現できる可能性がある。
Excelをダウンロード
タグ:Excel
posted by Takashi Inoue at 17:48| Comment(0)
| メモ
2020年05月23日
YouTube Music の文字化けを解消する (MP3タグの文字コード変換)

YouTube Music は PC やスマホで音楽を視聴するサービス。自分の手持ちの MP3 をアップロードすることもできる (無料プランでは5万曲まで。視聴できるのは本人だけ)
古い MP3 をアップロードすると日本語が文字化けすることがあるが、その原因は MP3 タグ情報が文字コード SJIS で書き込まれているためであることが多い。その場合、以下のスクリプトを利用することで問題を解消できる。
指定フォルダ内の MP3 ファイルについて、タグ情報の文字コードを変換するスクリプト (SJIS → UTF16変換)
https://github.com/itak0101/Python-Tips/blob/master/ConvertMP3tag_SJIStoUTF16.py
Reference:
[1] Mac における MP3 ファイルの文字化けを直してみた
[2] eyed3 / mp3のtag情報をpythonで操作する
[3] Docs ≫ eyed3 module ≫ eyed3 package ≫ eyed3.id3 package
[4] Shift_JISとUTF-8とASCIIを行き来する
[5] Pythonのchardetで文字コード判定
タグ:python
posted by Takashi Inoue at 23:10| Comment(0)
| メモ
2019年07月13日
G検定の受験レポート (2019年7月)
G検定: JDLA Deep Learning for GENERAL に合格しました (2019年7月)
公式ページ: https://www.jdla.org/business/certificate/
G検定は社団法人日本ディープラーニング協会(JDLA)が主催する試験です。
G検定は現在のところ民間資格に近く、情報処理技術者試験のような経産省認定や、
統計検定のような学会認定は受けていないようです。
JDLAは人工知能業界の著名人である東京大学の松尾教授を理事長として、
研究機関(大学など)と企業(ABEJA社,Brainpad社など)が協力して運営している組織です。
■試験概要
・出題範囲
機械学習の歴史、各種アルゴリズムとその特徴、時事問題などが問われます。
G検定はジェネラリスト向けの試験のため、数学的な話は少なく、
プログラミング方法などについてもほとんど出題されません。
(エンジニア向けにはE検定という別試験があります)
・出題レベル
高校三年生程度の数学力があれば十分合格可能です。
・試験形式
Web試験であり、試験中のノート参照や Google検索もOKです。
後述する公式参考書にも「試験中にWeb検索しましょう」と書いてあります。
(しかし1問30秒ペースで答えてゆく試験なので、ある程度は暗記しないと間に合いません)
■教材
・公式テキスト / 公式問題集 / 公式参考書






・模擬テスト (運営会社とJDLAの関係性は不明)
http://study-ai.com/generalist/
■勉強の仕方
・公式テキストを2週読み、公式問題集を2週解きました。
・AI白書も購入したものの、膨大な量で読む時間がありませんでした。
・模擬テストは受けませんでした。
※Kindle版の落とし穴
試験中にノート参照・Web検索が可能なため、
それを見越してテキスト等の書籍はKindle版を購入しました。
しかしKindle内の検索速度が遅く、検索ヒット率も悪いため、
結局テキストファイルでまとめノートを作成することにしました。
■試験当日
・受験環境
PCを2台用意し、1台を回答用、もう1台を検索用としました。
検索用PCには、自分でまとめたノートと Webブラウザ(検索用)を表示。
・出題内容
公式テキストと公式問題集で、5割以上は得点できる内容でした。
その他は時事問題や法律問題が多く、事前に学習しておくことが難しい内容でした。
試験中に Web検索してページ内容を瞬時に把握して回答、という作業が多く発生し、
時間との戦いになりました。
■所感
・おすすめです
公式テキストが読み物として面白く、公式問題集も解きやすくて楽しい試験でした。
試験当日は時間との戦いが大変なものの、試験中に検索して学んだことも多く、
得るものの多い試験だったように感じています。
・合格者イベントも楽しみ
G検定合格者が集まる会が定期的に開催されているようです。
参加することで最新事例を知ることができそうです。
・統計検定との相性も良い
統計検定の方が数学寄りなので、統計検定→G検定の流れなら
スムーズに学習できると思います。
公式ページ: https://www.jdla.org/business/certificate/
G検定は社団法人日本ディープラーニング協会(JDLA)が主催する試験です。
G検定は現在のところ民間資格に近く、情報処理技術者試験のような経産省認定や、
統計検定のような学会認定は受けていないようです。
JDLAは人工知能業界の著名人である東京大学の松尾教授を理事長として、
研究機関(大学など)と企業(ABEJA社,Brainpad社など)が協力して運営している組織です。
■試験概要
・出題範囲
機械学習の歴史、各種アルゴリズムとその特徴、時事問題などが問われます。
G検定はジェネラリスト向けの試験のため、数学的な話は少なく、
プログラミング方法などについてもほとんど出題されません。
(エンジニア向けにはE検定という別試験があります)
・出題レベル
高校三年生程度の数学力があれば十分合格可能です。
・試験形式
Web試験であり、試験中のノート参照や Google検索もOKです。
後述する公式参考書にも「試験中にWeb検索しましょう」と書いてあります。
(しかし1問30秒ペースで答えてゆく試験なので、ある程度は暗記しないと間に合いません)
■教材
・公式テキスト / 公式問題集 / 公式参考書
・模擬テスト (運営会社とJDLAの関係性は不明)
http://study-ai.com/generalist/
■勉強の仕方
・公式テキストを2週読み、公式問題集を2週解きました。
・AI白書も購入したものの、膨大な量で読む時間がありませんでした。
・模擬テストは受けませんでした。
※Kindle版の落とし穴
試験中にノート参照・Web検索が可能なため、
それを見越してテキスト等の書籍はKindle版を購入しました。
しかしKindle内の検索速度が遅く、検索ヒット率も悪いため、
結局テキストファイルでまとめノートを作成することにしました。
■試験当日
・受験環境
PCを2台用意し、1台を回答用、もう1台を検索用としました。
検索用PCには、自分でまとめたノートと Webブラウザ(検索用)を表示。
・出題内容
公式テキストと公式問題集で、5割以上は得点できる内容でした。
その他は時事問題や法律問題が多く、事前に学習しておくことが難しい内容でした。
試験中に Web検索してページ内容を瞬時に把握して回答、という作業が多く発生し、
時間との戦いになりました。
■所感
・おすすめです
公式テキストが読み物として面白く、公式問題集も解きやすくて楽しい試験でした。
試験当日は時間との戦いが大変なものの、試験中に検索して学んだことも多く、
得るものの多い試験だったように感じています。
・合格者イベントも楽しみ
G検定合格者が集まる会が定期的に開催されているようです。
参加することで最新事例を知ることができそうです。
・統計検定との相性も良い
統計検定の方が数学寄りなので、統計検定→G検定の流れなら
スムーズに学習できると思います。
posted by Takashi Inoue at 23:13| Comment(0)
| 資格試験
2019年05月19日
書籍: ディジタル画像処理
画像処理を体系的に解説した一冊。
実務で Deep Learning を利用した画像認識システムを提案をすると、
導入済システム・対抗馬として「画像処理」と呼ばれるものが挙げられることが多い。
そのため DLと「画像認識」を比較する際の論点を整理する目的で、本書を購入した。
本書ではディジタル画像の歴史・撮影方法・後処理・分析・出力まで
多岐にわたる知識が体系的に紹介されているため、これから画像認識を使った
システム・ビジネスに関わる人にはぜひお勧めしたい。
説明が丁寧なだけでなく、レイアウトも美しいため、ストレスなく読み進めることができる。
本書の目次は以下の通り。
11章が先述の「画像認識」、12章がDLを含む機械学習の解説となっている。
01. イントロダクション
02. ディジタル画像の撮影
03. 画像の性質と色空間
04. 画素ごとの濃淡変換
05. 領域に基づく濃淡変換(空間フィルタリング)
06. 周波数領域におけるフィルタリング
07. 画像の復元と生成
08. 幾何学変換
09. 2値画像処理
10. 領域処理
11. パターン・図形・特徴の検出とマッチング
12. パターン認識
13. 動画像処理
14. 画像からの3次元復元
15. 光学的解析とシーンの復元
16. 画像符号化
付録. 画像処理の歴史、知的財産権
本書は 公益財団法人 画像情報教育振興協会 が主催する
「画像処理エンジニア検定(エキスパート)」という資格の標準テキストとのこと。
知識の定着のために受験するのも良いかもしれない。
https://www.cgarts.or.jp/kentei/about/img_engineer/
posted by Takashi Inoue at 21:43| Comment(0)
| 書籍