PythonでExcelデータ処理

 PythonのopenpyxlというライブラリでExcelブックを編集する本を読んでいます。Excelを使うのはもっぱら職場で、Pythonが使える職場は少ないので、あまり関心は高くありません。「流行りモノは押さえておこう」ということで図書館で借りています。

 オープンで手に入るデータはCSV形式が多く、データ型などのメタデータが失われがちです。ExcelはSQLほど厳密ではありませんがメタデータを記録でき複数のワークシートを持てるので、そのあたりに魅力を感じる方なら試してみる価値はありそうです。

 世間でExcel+Pythonが流行っているのはRPAなどの文脈もあるのだとは思いますが、メンテナンス性を考慮するとPython人材が潤沢な組織以外での導入はお勧め出来ません。職場でPythonを使える方はその時点で恵まれた職場だとは思いますが、当面は昔のPerl/AWKのような「書き捨て」用途と割り切った方が良さそうです。

Ubuntu 21.04が待ち遠しい

DSC_0826
Ubuntu 21.04 Daily Build

 ASUSのノートPCを年明けにAmazonのセールで買いました。Ryzen 4600HとGTX 1650が載ったゲーミング仕様ですが、Linuxを入れる予定です。

 Linuxを入れるのはデータベースとデータ分析、Python機械学習が目的です。PostgreSQLは6コアを使ってくれますし、Tensorflow/Kerasなどディープラーニングのフレームワークもnvidia-smiなどの設定がうまく行けばGPUの並列処理を使ってくれるはずです。

 しかし今はまだWindows 10のまま。常用しているUbuntu 20.04のLinuxカーネルがAMD Ryzen 4000系のAPUに未対応だからです。

 カーネルだけ更新して世間のTipsが使えなくなるのも嫌なので、2021年4月リリース予定のUbuntu 21.04に合わせてOSを入れ替える予定です。

 写真はDaily BuildをUSBメモリから起動したところ。AMDへの対応が遅れがちなLinuxですが、Linusも今ではAMDのThreadripperを愛用しているとのこと。このノートでUbuntuが安定稼働することに期待しています。

 このブログでは、Ubuntu 21.04のインストールから各種環境構築まで一連の過程を記事として掲載しようと思っています。

反省

 ウェブ関連の部署に長くいたため、最近まで「ウェブのことは分かっている」と思い込んでいました。

 ところが実際にはCMSなどのツールやパートナー企業に甘えていただけで、徐々にウェブ技術の進化に取り残されている自分に気づきました。

 その間、何もやっていたわけではありません。Google AnalyticsやAdobe Analytics(旧SiteCatalyst)によるアクセス解析、フィード広告の管理や集客のためのSEOなどなど……。しかし会社を離れ、コンテンツが無ければ分析や広告に関するスキルは無意味と思い知らされました。