<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	
	xmlns:georss="http://www.georss.org/georss"
	xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#"
	>

<channel>
	<title>kaggle - MasaruのIT＆マーケティングBLOG | Info Tech &amp; Marketing BLOG by Masaru</title>
	<atom:link href="/tag/kaggle/feed/" rel="self" type="application/rss+xml" />
	<link>/</link>
	<description>Cross the cliffs of the times</description>
	<lastBuildDate>Tue, 13 Jul 2021 01:37:27 +0000</lastBuildDate>
	<language>ja</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=5.8</generator>
<site xmlns="com-wordpress:feed-additions:1">191177362</site>	<item>
		<title>Google Colaboratory(Colab Pro)でkaggleデータをダウンロードする方法[備忘録]</title>
		<link>/2021/07/13/google-colaboratorycolab-pro%e3%81%a7kaggle%e3%83%87%e3%83%bc%e3%82%bf%e3%82%92%e3%83%80%e3%82%a6%e3%83%b3%e3%83%ad%e3%83%bc%e3%83%89%e3%81%99%e3%82%8b%e6%96%b9%e6%b3%95%e5%82%99%e5%bf%98%e9%8c%b2/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=google-colaboratorycolab-pro%25e3%2581%25a7kaggle%25e3%2583%2587%25e3%2583%25bc%25e3%2582%25bf%25e3%2582%2592%25e3%2583%2580%25e3%2582%25a6%25e3%2583%25b3%25e3%2583%25ad%25e3%2583%25bc%25e3%2583%2589%25e3%2581%2599%25e3%2582%258b%25e6%2596%25b9%25e6%25b3%2595%25e5%2582%2599%25e5%25bf%2598%25e9%258c%25b2</link>
					<comments>/2021/07/13/google-colaboratorycolab-pro%e3%81%a7kaggle%e3%83%87%e3%83%bc%e3%82%bf%e3%82%92%e3%83%80%e3%82%a6%e3%83%b3%e3%83%ad%e3%83%bc%e3%83%89%e3%81%99%e3%82%8b%e6%96%b9%e6%b3%95%e5%82%99%e5%bf%98%e9%8c%b2/#respond</comments>
		
		<dc:creator><![CDATA[masaru]]></dc:creator>
		<pubDate>Tue, 13 Jul 2021 00:56:43 +0000</pubDate>
				<category><![CDATA[IT]]></category>
		<category><![CDATA[データ分析]]></category>
		<category><![CDATA[Colab Pro]]></category>
		<category><![CDATA[Google Colab]]></category>
		<category><![CDATA[Googleドライブ]]></category>
		<category><![CDATA[kaggle]]></category>
		<category><![CDATA[ビッグデータ]]></category>
		<guid isPermaLink="false">/?p=514</guid>

					<description><![CDATA[<p>　技術的な要素は無いのですが、忘れやすいのでコピペ出来るように記事を残しておきます。 kaggle.jsonをGoogleドライブに保存しておく 　kaggleのAccount画面でCreate New API Toke&#8230; <a class="more-link" href="/2021/07/13/google-colaboratorycolab-pro%e3%81%a7kaggle%e3%83%87%e3%83%bc%e3%82%bf%e3%82%92%e3%83%80%e3%82%a6%e3%83%b3%e3%83%ad%e3%83%bc%e3%83%89%e3%81%99%e3%82%8b%e6%96%b9%e6%b3%95%e5%82%99%e5%bf%98%e9%8c%b2/">続きを読む <span class="screen-reader-text">Google Colaboratory(Colab Pro)でkaggleデータをダウンロードする方法[備忘録]</span></a></p>
<p>The post <a href="/2021/07/13/google-colaboratorycolab-pro%e3%81%a7kaggle%e3%83%87%e3%83%bc%e3%82%bf%e3%82%92%e3%83%80%e3%82%a6%e3%83%b3%e3%83%ad%e3%83%bc%e3%83%89%e3%81%99%e3%82%8b%e6%96%b9%e6%b3%95%e5%82%99%e5%bf%98%e9%8c%b2/">Google Colaboratory(Colab Pro)でkaggleデータをダウンロードする方法[備忘録]</a> first appeared on <a href="/">MasaruのIT＆マーケティングBLOG  |  Info Tech & Marketing BLOG by Masaru</a>.</p>]]></description>
										<content:encoded><![CDATA[<p>　技術的な要素は無いのですが、忘れやすいのでコピペ出来るように記事を残しておきます。</p>



<div style="height:100px" aria-hidden="true" class="wp-block-spacer"></div>



<h2>kaggle.jsonをGoogleドライブに保存しておく</h2>



<p>　<a href="https://www.kaggle.com/" target="_blank" rel="noreferrer noopener">kaggle</a>のAccount画面で<mark>Create New API Token</mark>ボタンを押して<mark>kaggle.json</mark>をダウンロードし、Googleドライブに保存する(私の場合は’Colab Notebooks&#8217;直下)。</p>



<div style="height:100px" aria-hidden="true" class="wp-block-spacer"></div>



<h2>Colabの規定ディレクトリにkaggle.jsonをコピー</h2>



<p>　Colabのノートブック画面でGoogleドライブに接続。</p>



<div class="hcb_wrap"><pre class="prism line-numbers lang-python" data-lang="Python"><code>from google.colab import drive
drive.mount(&#39;/content/drive&#39;)</code></pre></div>



<p>　ターミナルでkaggle.jsonを所定の位置に配置。ColabのターミナルではCtrl+C、Ctrl+Vでコピペ出来ないので、それぞれ<mark>Ctrl+Insert</mark>、<mark>Shift+Insert</mark>のショートカットで代用する（メニューバーの『編集』でもコピペ出来ない……）。</p>



<div class="hcb_wrap"><pre class="prism line-numbers lang-bash" data-lang="Bash"><code>/content# mkdir /root/.kaggle/
/content# cp &#39;/content/drive/MyDrive/Colab Notebooks/kaggle.json&#39; /root/.kaggle/</code></pre></div>



<div style="height:100px" aria-hidden="true" class="wp-block-spacer"></div>



<h2>kaggleコマンドでデータダウンロード</h2>



<p>　Kaggleのコマンド自体はkaggleのサイトに表示されるので、<mark>コンペの利用条件を承諾してから</mark>コマンドをコピペするだけです。</p>



<figure class="wp-block-image size-large"><img loading="lazy" width="750" height="388" src="https://i2.wp.com/can.ne.jp/wp-content/uploads/2021/07/kaggle.jpg?resize=750%2C388&#038;ssl=1" alt="" class="wp-image-516" srcset="https://i2.wp.com/can.ne.jp/wp-content/uploads/2021/07/kaggle.jpg?resize=1024%2C530&amp;ssl=1 1024w, https://i2.wp.com/can.ne.jp/wp-content/uploads/2021/07/kaggle.jpg?resize=300%2C155&amp;ssl=1 300w, https://i2.wp.com/can.ne.jp/wp-content/uploads/2021/07/kaggle.jpg?resize=768%2C397&amp;ssl=1 768w, https://i2.wp.com/can.ne.jp/wp-content/uploads/2021/07/kaggle.jpg?resize=1536%2C795&amp;ssl=1 1536w, https://i2.wp.com/can.ne.jp/wp-content/uploads/2021/07/kaggle.jpg?resize=1568%2C811&amp;ssl=1 1568w, https://i2.wp.com/can.ne.jp/wp-content/uploads/2021/07/kaggle.jpg?w=1801&amp;ssl=1 1801w" sizes="(max-width: 750px) 100vw, 750px" data-recalc-dims="1" /></figure>



<div class="hcb_wrap"><pre class="prism line-numbers lang-plain"><code>/content# kaggle competitions download -c house-prices-advanced-regression-techniques
Warning: Looks like you&#39;re using an outdated API Version, please consider updating (server 1.5.12 / client 1.5.4)
Downloading train.csv to /content
  0%|                                                                                           | 0.00/450k [00:00&lt;?, ?B/s]
100%|███████████████████████████████████████████████████████████████████████████████████| 450k/450k [00:00&lt;00:00, 61.1MB/s]
Downloading sample_submission.csv to /content
  0%|                                                                                          | 0.00/31.2k [00:00&lt;?, ?B/s]
100%|█████████████████████████████████████████████████████████████████████████████████| 31.2k/31.2k [00:00&lt;00:00, 33.8MB/s]
Downloading test.csv to /content
  0%|                                                                                           | 0.00/441k [00:00&lt;?, ?B/s]
100%|███████████████████████████████████████████████████████████████████████████████████| 441k/441k [00:00&lt;00:00, 60.6MB/s]
Downloading data_description.txt to /content
  0%|                                                                                          | 0.00/13.1k [00:00&lt;?, ?B/s]
100%|█████████████████████████████████████████████████████████████████████████████████| 13.1k/13.1k [00:00&lt;00:00, 12.4MB/s]</code></pre></div>



<div style="height:100px" aria-hidden="true" class="wp-block-spacer"></div>



<h2>Colabの操作性は初心者に優しくない</h2>



<p>　Colabのインスタンスを立ち上げるたびに各種操作が必要なのが果てしなくだるいですね……。GoogleのColabチームは操作性の向上に消極的なようで、細かいところでストレスが蓄積します。<a href="/2021/06/27/google%e3%83%89%e3%83%a9%e3%82%a4%e3%83%96%e3%81%ae%e9%ac%bc%e4%bb%95%e6%a7%98%e3%81%aa%e3%80%8e%e3%83%95%e3%82%a9%e3%83%ab%e3%83%80%e3%83%80%e3%82%a6%e3%83%b3%e3%83%ad%e3%83%bc%e3%83%89%e3%80%8f/" target="_blank" rel="noreferrer noopener">GBレベルのデータダウンロードが厄介</a>なのも大きな弱点です。</p>



<p>　AutoMLがオープンソースでも出てきており、細かいチューニングが不要な用途ではnotebookの体裁すら不要な<mark>ノーコード</mark>の時代になってきています。本来はGUIでボタンぽちーで分析完了出来てしかるべきです。ちなみに<s>お高い</s><a href="https://www.datarobot.com/jp/" target="_blank" rel="noreferrer noopener">DataRobot</a>や無料でもそこそこ使える<a href="https://www.ibm.com/jp-ja/cloud/watson-studio/autoai" target="_blank" rel="noreferrer noopener">AutoAI with IBM Watson Studio</a>では<mark>既にGUIでAutoMLが可能です</mark>。</p>



<div style="height:100px" aria-hidden="true" class="wp-block-spacer"></div>



<h2>伸びしろがある若い方なら思い切ってワークステーションを買ってみては？</h2>



<p>　ワークステーションに50万円払える方は、買ってしまってローカルのJupyter Notebookで分析した方がシアワセになれるかも知れません。もちろんLinuxの知識が多少はあることが前提ですが。</p>



<p>　私が大学時代に貯金をはたいて購入したDECのパソコンは50万円しましたから、伸びしろがある方なら無駄な投資にはならないと思います。</p>
		<div class="wpulike wpulike-default " ><div class="wp_ulike_general_class wp_ulike_is_not_liked"><button type="button"
					aria-label="いいねボタン"
					data-ulike-id="514"
					data-ulike-nonce="10295a1006"
					data-ulike-type="post"
					data-ulike-template="wpulike-default"
					data-ulike-display-likers=""
					data-ulike-likers-style="popover"
					class="wp_ulike_btn wp_ulike_put_image wp_post_btn_514"></button><span class="count-box wp_ulike_counter_up" data-ulike-counter-value="0"></span>			</div></div>
	<p><a class="a2a_button_twitter" href="https://www.addtoany.com/add_to/twitter?linkurl=%2F2021%2F07%2F13%2Fgoogle-colaboratorycolab-pro%25e3%2581%25a7kaggle%25e3%2583%2587%25e3%2583%25bc%25e3%2582%25bf%25e3%2582%2592%25e3%2583%2580%25e3%2582%25a6%25e3%2583%25b3%25e3%2583%25ad%25e3%2583%25bc%25e3%2583%2589%25e3%2581%2599%25e3%2582%258b%25e6%2596%25b9%25e6%25b3%2595%25e5%2582%2599%25e5%25bf%2598%25e9%258c%25b2%2F&amp;linkname=Google%20Colaboratory%28Colab%20Pro%29%E3%81%A7kaggle%E3%83%87%E3%83%BC%E3%82%BF%E3%82%92%E3%83%80%E3%82%A6%E3%83%B3%E3%83%AD%E3%83%BC%E3%83%89%E3%81%99%E3%82%8B%E6%96%B9%E6%B3%95%5B%E5%82%99%E5%BF%98%E9%8C%B2%5D" title="Twitter" rel="nofollow noopener" target="_blank"></a><a class="a2a_button_line" href="https://www.addtoany.com/add_to/line?linkurl=%2F2021%2F07%2F13%2Fgoogle-colaboratorycolab-pro%25e3%2581%25a7kaggle%25e3%2583%2587%25e3%2583%25bc%25e3%2582%25bf%25e3%2582%2592%25e3%2583%2580%25e3%2582%25a6%25e3%2583%25b3%25e3%2583%25ad%25e3%2583%25bc%25e3%2583%2589%25e3%2581%2599%25e3%2582%258b%25e6%2596%25b9%25e6%25b3%2595%25e5%2582%2599%25e5%25bf%2598%25e9%258c%25b2%2F&amp;linkname=Google%20Colaboratory%28Colab%20Pro%29%E3%81%A7kaggle%E3%83%87%E3%83%BC%E3%82%BF%E3%82%92%E3%83%80%E3%82%A6%E3%83%B3%E3%83%AD%E3%83%BC%E3%83%89%E3%81%99%E3%82%8B%E6%96%B9%E6%B3%95%5B%E5%82%99%E5%BF%98%E9%8C%B2%5D" title="Line" rel="nofollow noopener" target="_blank"></a><a class="a2a_button_facebook" href="https://www.addtoany.com/add_to/facebook?linkurl=%2F2021%2F07%2F13%2Fgoogle-colaboratorycolab-pro%25e3%2581%25a7kaggle%25e3%2583%2587%25e3%2583%25bc%25e3%2582%25bf%25e3%2582%2592%25e3%2583%2580%25e3%2582%25a6%25e3%2583%25b3%25e3%2583%25ad%25e3%2583%25bc%25e3%2583%2589%25e3%2581%2599%25e3%2582%258b%25e6%2596%25b9%25e6%25b3%2595%25e5%2582%2599%25e5%25bf%2598%25e9%258c%25b2%2F&amp;linkname=Google%20Colaboratory%28Colab%20Pro%29%E3%81%A7kaggle%E3%83%87%E3%83%BC%E3%82%BF%E3%82%92%E3%83%80%E3%82%A6%E3%83%B3%E3%83%AD%E3%83%BC%E3%83%89%E3%81%99%E3%82%8B%E6%96%B9%E6%B3%95%5B%E5%82%99%E5%BF%98%E9%8C%B2%5D" title="Facebook" rel="nofollow noopener" target="_blank"></a><a class="a2a_button_facebook_messenger" href="https://www.addtoany.com/add_to/facebook_messenger?linkurl=%2F2021%2F07%2F13%2Fgoogle-colaboratorycolab-pro%25e3%2581%25a7kaggle%25e3%2583%2587%25e3%2583%25bc%25e3%2582%25bf%25e3%2582%2592%25e3%2583%2580%25e3%2582%25a6%25e3%2583%25b3%25e3%2583%25ad%25e3%2583%25bc%25e3%2583%2589%25e3%2581%2599%25e3%2582%258b%25e6%2596%25b9%25e6%25b3%2595%25e5%2582%2599%25e5%25bf%2598%25e9%258c%25b2%2F&amp;linkname=Google%20Colaboratory%28Colab%20Pro%29%E3%81%A7kaggle%E3%83%87%E3%83%BC%E3%82%BF%E3%82%92%E3%83%80%E3%82%A6%E3%83%B3%E3%83%AD%E3%83%BC%E3%83%89%E3%81%99%E3%82%8B%E6%96%B9%E6%B3%95%5B%E5%82%99%E5%BF%98%E9%8C%B2%5D" title="Messenger" rel="nofollow noopener" target="_blank"></a><a class="a2a_button_copy_link" href="https://www.addtoany.com/add_to/copy_link?linkurl=%2F2021%2F07%2F13%2Fgoogle-colaboratorycolab-pro%25e3%2581%25a7kaggle%25e3%2583%2587%25e3%2583%25bc%25e3%2582%25bf%25e3%2582%2592%25e3%2583%2580%25e3%2582%25a6%25e3%2583%25b3%25e3%2583%25ad%25e3%2583%25bc%25e3%2583%2589%25e3%2581%2599%25e3%2582%258b%25e6%2596%25b9%25e6%25b3%2595%25e5%2582%2599%25e5%25bf%2598%25e9%258c%25b2%2F&amp;linkname=Google%20Colaboratory%28Colab%20Pro%29%E3%81%A7kaggle%E3%83%87%E3%83%BC%E3%82%BF%E3%82%92%E3%83%80%E3%82%A6%E3%83%B3%E3%83%AD%E3%83%BC%E3%83%89%E3%81%99%E3%82%8B%E6%96%B9%E6%B3%95%5B%E5%82%99%E5%BF%98%E9%8C%B2%5D" title="Copy Link" rel="nofollow noopener" target="_blank"></a><a class="a2a_dd addtoany_share_save addtoany_share" href="https://www.addtoany.com/share#url=%2F2021%2F07%2F13%2Fgoogle-colaboratorycolab-pro%25e3%2581%25a7kaggle%25e3%2583%2587%25e3%2583%25bc%25e3%2582%25bf%25e3%2582%2592%25e3%2583%2580%25e3%2582%25a6%25e3%2583%25b3%25e3%2583%25ad%25e3%2583%25bc%25e3%2583%2589%25e3%2581%2599%25e3%2582%258b%25e6%2596%25b9%25e6%25b3%2595%25e5%2582%2599%25e5%25bf%2598%25e9%258c%25b2%2F&#038;title=Google%20Colaboratory%28Colab%20Pro%29%E3%81%A7kaggle%E3%83%87%E3%83%BC%E3%82%BF%E3%82%92%E3%83%80%E3%82%A6%E3%83%B3%E3%83%AD%E3%83%BC%E3%83%89%E3%81%99%E3%82%8B%E6%96%B9%E6%B3%95%5B%E5%82%99%E5%BF%98%E9%8C%B2%5D" data-a2a-url="/2021/07/13/google-colaboratorycolab-pro%e3%81%a7kaggle%e3%83%87%e3%83%bc%e3%82%bf%e3%82%92%e3%83%80%e3%82%a6%e3%83%b3%e3%83%ad%e3%83%bc%e3%83%89%e3%81%99%e3%82%8b%e6%96%b9%e6%b3%95%e5%82%99%e5%bf%98%e9%8c%b2/" data-a2a-title="Google Colaboratory(Colab Pro)でkaggleデータをダウンロードする方法[備忘録]"></a></p><p>The post <a href="/2021/07/13/google-colaboratorycolab-pro%e3%81%a7kaggle%e3%83%87%e3%83%bc%e3%82%bf%e3%82%92%e3%83%80%e3%82%a6%e3%83%b3%e3%83%ad%e3%83%bc%e3%83%89%e3%81%99%e3%82%8b%e6%96%b9%e6%b3%95%e5%82%99%e5%bf%98%e9%8c%b2/">Google Colaboratory(Colab Pro)でkaggleデータをダウンロードする方法[備忘録]</a> first appeared on <a href="/">MasaruのIT＆マーケティングBLOG  |  Info Tech & Marketing BLOG by Masaru</a>.</p>]]></content:encoded>
					
					<wfw:commentRss>/2021/07/13/google-colaboratorycolab-pro%e3%81%a7kaggle%e3%83%87%e3%83%bc%e3%82%bf%e3%82%92%e3%83%80%e3%82%a6%e3%83%b3%e3%83%ad%e3%83%bc%e3%83%89%e3%81%99%e3%82%8b%e6%96%b9%e6%b3%95%e5%82%99%e5%bf%98%e9%8c%b2/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">514</post-id>	</item>
		<item>
		<title>Kaggleのデータをコンペ以外の目的で利用する</title>
		<link>/2021/04/06/kaggle%e3%81%ae%e3%83%87%e3%83%bc%e3%82%bf%e3%82%92%e3%82%b3%e3%83%b3%e3%83%9a%e4%bb%a5%e5%a4%96%e3%81%ae%e7%9b%ae%e7%9a%84%e3%81%a7%e5%88%a9%e7%94%a8%e3%81%99%e3%82%8b/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=kaggle%25e3%2581%25ae%25e3%2583%2587%25e3%2583%25bc%25e3%2582%25bf%25e3%2582%2592%25e3%2582%25b3%25e3%2583%25b3%25e3%2583%259a%25e4%25bb%25a5%25e5%25a4%2596%25e3%2581%25ae%25e7%259b%25ae%25e7%259a%2584%25e3%2581%25a7%25e5%2588%25a9%25e7%2594%25a8%25e3%2581%2599%25e3%2582%258b</link>
					<comments>/2021/04/06/kaggle%e3%81%ae%e3%83%87%e3%83%bc%e3%82%bf%e3%82%92%e3%82%b3%e3%83%b3%e3%83%9a%e4%bb%a5%e5%a4%96%e3%81%ae%e7%9b%ae%e7%9a%84%e3%81%a7%e5%88%a9%e7%94%a8%e3%81%99%e3%82%8b/#respond</comments>
		
		<dc:creator><![CDATA[masaru]]></dc:creator>
		<pubDate>Tue, 06 Apr 2021 10:14:44 +0000</pubDate>
				<category><![CDATA[IT]]></category>
		<category><![CDATA[Webマーケティング]]></category>
		<category><![CDATA[データ分析]]></category>
		<category><![CDATA[kaggle]]></category>
		<guid isPermaLink="false">/?p=227</guid>

					<description><![CDATA[<p>データサイエンティストに敵わないからといって避けて通るのはもったいない 　Kaggleはコンペティションで有名なため「データサイエンティスト以外はお断り」というイメージがあります。しかし、優秀な方々に及ばないことが分かっ&#8230; <a class="more-link" href="/2021/04/06/kaggle%e3%81%ae%e3%83%87%e3%83%bc%e3%82%bf%e3%82%92%e3%82%b3%e3%83%b3%e3%83%9a%e4%bb%a5%e5%a4%96%e3%81%ae%e7%9b%ae%e7%9a%84%e3%81%a7%e5%88%a9%e7%94%a8%e3%81%99%e3%82%8b/">続きを読む <span class="screen-reader-text">Kaggleのデータをコンペ以外の目的で利用する</span></a></p>
<p>The post <a href="/2021/04/06/kaggle%e3%81%ae%e3%83%87%e3%83%bc%e3%82%bf%e3%82%92%e3%82%b3%e3%83%b3%e3%83%9a%e4%bb%a5%e5%a4%96%e3%81%ae%e7%9b%ae%e7%9a%84%e3%81%a7%e5%88%a9%e7%94%a8%e3%81%99%e3%82%8b/">Kaggleのデータをコンペ以外の目的で利用する</a> first appeared on <a href="/">MasaruのIT＆マーケティングBLOG  |  Info Tech & Marketing BLOG by Masaru</a>.</p>]]></description>
										<content:encoded><![CDATA[<h2>データサイエンティストに敵わないからといって避けて通るのはもったいない</h2>



<p>　Kaggleはコンペティションで有名なため「データサイエンティスト以外はお断り」というイメージがあります。しかし、優秀な方々に及ばないことが分かっていてもKaggleを避けて通るのはもったいないと思います。</p>



<p>　BIツールの学習など、実務寄りのデータがほしい機会は多くあります。Kaggleにどのようなデータがあるか知っていれば、目的に近いデータを入手出来ます。特にマーケティング分野のデータは企業秘密の塊であり一般公開されることが少ないため、Kaggleのデータはとても貴重なものです。</p>



<p>　本日は、昨年Twitterでも触れていた「<a href="https://www.kaggle.com/c/ga-customer-revenue-prediction/" target="_blank" rel="noreferrer noopener">Google Analytics Customer Revenue Prediction &#8211; Predict how much GStore customers will spend</a>」をご紹介します。</p>



<div style="height:100px" aria-hidden="true" class="wp-block-spacer"></div>



<h2>実在するEコマースサイトのアクセスログ</h2>



<p>　このコンペはRStudio社の主催で、GoogleのEコマースサイト『GStore』のセッション単位のアクセスログが約33GB、提供されています。</p>



<figure class="wp-block-image size-large"><img loading="lazy" width="750" height="492" src="https://i0.wp.com/can.ne.jp/wp-content/uploads/2021/04/Google_Analytics_Customer_Revenue_Prediction-Kaggle.png?resize=750%2C492&#038;ssl=1" alt="" class="wp-image-232" srcset="https://i0.wp.com/can.ne.jp/wp-content/uploads/2021/04/Google_Analytics_Customer_Revenue_Prediction-Kaggle.png?resize=1024%2C672&amp;ssl=1 1024w, https://i0.wp.com/can.ne.jp/wp-content/uploads/2021/04/Google_Analytics_Customer_Revenue_Prediction-Kaggle.png?resize=300%2C197&amp;ssl=1 300w, https://i0.wp.com/can.ne.jp/wp-content/uploads/2021/04/Google_Analytics_Customer_Revenue_Prediction-Kaggle.png?resize=768%2C504&amp;ssl=1 768w, https://i0.wp.com/can.ne.jp/wp-content/uploads/2021/04/Google_Analytics_Customer_Revenue_Prediction-Kaggle.png?w=1352&amp;ssl=1 1352w" sizes="(max-width: 750px) 100vw, 750px" data-recalc-dims="1" /></figure>



<p>　CSVのカラムにJSON風のデータが詰め込まれていて処理が手強いですが、BIツールの基本である日次統計にもってこいです。参考書籍などで数10GBのデータを扱っている例は見たことがありませんが、<strong>これくらいのサイズがなければExcelで十分</strong>であり、データベースやBIツール、データ分析基盤などのスケーラビリティを試すなら最低でもGB単位のデータが必要です。</p>



<p>　昨年はこのCSVデータを自力での展開を試みましたが、データ構造が複雑なため簡単な置換処理ではテーブル構造に出来ませんでした。今年は<a href="https://www.kaggle.com/ashrafkhan94/googleanalytics-customer-revenue-eda-prediction/notebook" target="_blank" rel="noreferrer noopener">先達の方のnotebook</a>などを参考にして、まずはPostgreSQLへのデータ格納までたどり着きたいと考えています。他の方から学べるのもkaggleの良いところですね。</p>



<figure class="wp-block-image size-large"><img loading="lazy" width="750" height="492" src="https://i1.wp.com/can.ne.jp/wp-content/uploads/2021/04/notebook.png?resize=750%2C492&#038;ssl=1" alt="" class="wp-image-233" srcset="https://i1.wp.com/can.ne.jp/wp-content/uploads/2021/04/notebook.png?resize=1024%2C672&amp;ssl=1 1024w, https://i1.wp.com/can.ne.jp/wp-content/uploads/2021/04/notebook.png?resize=300%2C197&amp;ssl=1 300w, https://i1.wp.com/can.ne.jp/wp-content/uploads/2021/04/notebook.png?resize=768%2C504&amp;ssl=1 768w, https://i1.wp.com/can.ne.jp/wp-content/uploads/2021/04/notebook.png?w=1352&amp;ssl=1 1352w" sizes="(max-width: 750px) 100vw, 750px" data-recalc-dims="1" /></figure>



<div class="hcb_wrap"><pre class="prism line-numbers lang-bash" data-lang="Bash"><code>(base) masaru@ASUS-TUF-Gaming:~$ conda install --channel https://conda.anaconda.org/conda-forge kaggle
(base) masaru@ASUS-TUF-Gaming:~$ kaggle competitions download -c ga-customer-revenue-prediction</code></pre></div>
		<div class="wpulike wpulike-default " ><div class="wp_ulike_general_class wp_ulike_is_not_liked"><button type="button"
					aria-label="いいねボタン"
					data-ulike-id="227"
					data-ulike-nonce="0763a01704"
					data-ulike-type="post"
					data-ulike-template="wpulike-default"
					data-ulike-display-likers=""
					data-ulike-likers-style="popover"
					class="wp_ulike_btn wp_ulike_put_image wp_post_btn_227"></button><span class="count-box wp_ulike_counter_up" data-ulike-counter-value="0"></span>			</div></div>
	<p><a class="a2a_button_twitter" href="https://www.addtoany.com/add_to/twitter?linkurl=%2F2021%2F04%2F06%2Fkaggle%25e3%2581%25ae%25e3%2583%2587%25e3%2583%25bc%25e3%2582%25bf%25e3%2582%2592%25e3%2582%25b3%25e3%2583%25b3%25e3%2583%259a%25e4%25bb%25a5%25e5%25a4%2596%25e3%2581%25ae%25e7%259b%25ae%25e7%259a%2584%25e3%2581%25a7%25e5%2588%25a9%25e7%2594%25a8%25e3%2581%2599%25e3%2582%258b%2F&amp;linkname=Kaggle%E3%81%AE%E3%83%87%E3%83%BC%E3%82%BF%E3%82%92%E3%82%B3%E3%83%B3%E3%83%9A%E4%BB%A5%E5%A4%96%E3%81%AE%E7%9B%AE%E7%9A%84%E3%81%A7%E5%88%A9%E7%94%A8%E3%81%99%E3%82%8B" title="Twitter" rel="nofollow noopener" target="_blank"></a><a class="a2a_button_line" href="https://www.addtoany.com/add_to/line?linkurl=%2F2021%2F04%2F06%2Fkaggle%25e3%2581%25ae%25e3%2583%2587%25e3%2583%25bc%25e3%2582%25bf%25e3%2582%2592%25e3%2582%25b3%25e3%2583%25b3%25e3%2583%259a%25e4%25bb%25a5%25e5%25a4%2596%25e3%2581%25ae%25e7%259b%25ae%25e7%259a%2584%25e3%2581%25a7%25e5%2588%25a9%25e7%2594%25a8%25e3%2581%2599%25e3%2582%258b%2F&amp;linkname=Kaggle%E3%81%AE%E3%83%87%E3%83%BC%E3%82%BF%E3%82%92%E3%82%B3%E3%83%B3%E3%83%9A%E4%BB%A5%E5%A4%96%E3%81%AE%E7%9B%AE%E7%9A%84%E3%81%A7%E5%88%A9%E7%94%A8%E3%81%99%E3%82%8B" title="Line" rel="nofollow noopener" target="_blank"></a><a class="a2a_button_facebook" href="https://www.addtoany.com/add_to/facebook?linkurl=%2F2021%2F04%2F06%2Fkaggle%25e3%2581%25ae%25e3%2583%2587%25e3%2583%25bc%25e3%2582%25bf%25e3%2582%2592%25e3%2582%25b3%25e3%2583%25b3%25e3%2583%259a%25e4%25bb%25a5%25e5%25a4%2596%25e3%2581%25ae%25e7%259b%25ae%25e7%259a%2584%25e3%2581%25a7%25e5%2588%25a9%25e7%2594%25a8%25e3%2581%2599%25e3%2582%258b%2F&amp;linkname=Kaggle%E3%81%AE%E3%83%87%E3%83%BC%E3%82%BF%E3%82%92%E3%82%B3%E3%83%B3%E3%83%9A%E4%BB%A5%E5%A4%96%E3%81%AE%E7%9B%AE%E7%9A%84%E3%81%A7%E5%88%A9%E7%94%A8%E3%81%99%E3%82%8B" title="Facebook" rel="nofollow noopener" target="_blank"></a><a class="a2a_button_facebook_messenger" href="https://www.addtoany.com/add_to/facebook_messenger?linkurl=%2F2021%2F04%2F06%2Fkaggle%25e3%2581%25ae%25e3%2583%2587%25e3%2583%25bc%25e3%2582%25bf%25e3%2582%2592%25e3%2582%25b3%25e3%2583%25b3%25e3%2583%259a%25e4%25bb%25a5%25e5%25a4%2596%25e3%2581%25ae%25e7%259b%25ae%25e7%259a%2584%25e3%2581%25a7%25e5%2588%25a9%25e7%2594%25a8%25e3%2581%2599%25e3%2582%258b%2F&amp;linkname=Kaggle%E3%81%AE%E3%83%87%E3%83%BC%E3%82%BF%E3%82%92%E3%82%B3%E3%83%B3%E3%83%9A%E4%BB%A5%E5%A4%96%E3%81%AE%E7%9B%AE%E7%9A%84%E3%81%A7%E5%88%A9%E7%94%A8%E3%81%99%E3%82%8B" title="Messenger" rel="nofollow noopener" target="_blank"></a><a class="a2a_button_copy_link" href="https://www.addtoany.com/add_to/copy_link?linkurl=%2F2021%2F04%2F06%2Fkaggle%25e3%2581%25ae%25e3%2583%2587%25e3%2583%25bc%25e3%2582%25bf%25e3%2582%2592%25e3%2582%25b3%25e3%2583%25b3%25e3%2583%259a%25e4%25bb%25a5%25e5%25a4%2596%25e3%2581%25ae%25e7%259b%25ae%25e7%259a%2584%25e3%2581%25a7%25e5%2588%25a9%25e7%2594%25a8%25e3%2581%2599%25e3%2582%258b%2F&amp;linkname=Kaggle%E3%81%AE%E3%83%87%E3%83%BC%E3%82%BF%E3%82%92%E3%82%B3%E3%83%B3%E3%83%9A%E4%BB%A5%E5%A4%96%E3%81%AE%E7%9B%AE%E7%9A%84%E3%81%A7%E5%88%A9%E7%94%A8%E3%81%99%E3%82%8B" title="Copy Link" rel="nofollow noopener" target="_blank"></a><a class="a2a_dd addtoany_share_save addtoany_share" href="https://www.addtoany.com/share#url=%2F2021%2F04%2F06%2Fkaggle%25e3%2581%25ae%25e3%2583%2587%25e3%2583%25bc%25e3%2582%25bf%25e3%2582%2592%25e3%2582%25b3%25e3%2583%25b3%25e3%2583%259a%25e4%25bb%25a5%25e5%25a4%2596%25e3%2581%25ae%25e7%259b%25ae%25e7%259a%2584%25e3%2581%25a7%25e5%2588%25a9%25e7%2594%25a8%25e3%2581%2599%25e3%2582%258b%2F&#038;title=Kaggle%E3%81%AE%E3%83%87%E3%83%BC%E3%82%BF%E3%82%92%E3%82%B3%E3%83%B3%E3%83%9A%E4%BB%A5%E5%A4%96%E3%81%AE%E7%9B%AE%E7%9A%84%E3%81%A7%E5%88%A9%E7%94%A8%E3%81%99%E3%82%8B" data-a2a-url="/2021/04/06/kaggle%e3%81%ae%e3%83%87%e3%83%bc%e3%82%bf%e3%82%92%e3%82%b3%e3%83%b3%e3%83%9a%e4%bb%a5%e5%a4%96%e3%81%ae%e7%9b%ae%e7%9a%84%e3%81%a7%e5%88%a9%e7%94%a8%e3%81%99%e3%82%8b/" data-a2a-title="Kaggleのデータをコンペ以外の目的で利用する"></a></p><p>The post <a href="/2021/04/06/kaggle%e3%81%ae%e3%83%87%e3%83%bc%e3%82%bf%e3%82%92%e3%82%b3%e3%83%b3%e3%83%9a%e4%bb%a5%e5%a4%96%e3%81%ae%e7%9b%ae%e7%9a%84%e3%81%a7%e5%88%a9%e7%94%a8%e3%81%99%e3%82%8b/">Kaggleのデータをコンペ以外の目的で利用する</a> first appeared on <a href="/">MasaruのIT＆マーケティングBLOG  |  Info Tech & Marketing BLOG by Masaru</a>.</p>]]></content:encoded>
					
					<wfw:commentRss>/2021/04/06/kaggle%e3%81%ae%e3%83%87%e3%83%bc%e3%82%bf%e3%82%92%e3%82%b3%e3%83%b3%e3%83%9a%e4%bb%a5%e5%a4%96%e3%81%ae%e7%9b%ae%e7%9a%84%e3%81%a7%e5%88%a9%e7%94%a8%e3%81%99%e3%82%8b/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">227</post-id>	</item>
	</channel>
</rss>
