前々回「PythonとRの連携」で駆け足で紹介しましたが、RとPython間のデータ移動のまとめです。
本日のメニュー:RとPython間のデータ移動
RとPython間のデータ移動の方法です。早速やってみましょう。
Google Colaboratoryにログイン
まずはGoogle Colabにログインしましょう。
ファイルから「ノートブックを新規作成」をクリックし、新しいノートブックを作成します。
Googleドライブのマウント(必要に応じて)
次にインストール済みのパッケージを読み込むため、Googleドライブをマウントします。
インストール済みのRのパッケージを解凍(必要に応じて)
インストール済みのRのパッケージを解凍します。(圧縮保存したファイルの解凍)
%%shell
# Colab Notebooksのフォルダにlibrary.tar.gzを保存しておいた場合、インストールしたパッケージの復活
tar xzf "/content/drive/MyDrive/Colab Notebooks/library.tar.gz"
過去に「Colab Notebooks」に圧縮保存していたフォルダ「library」が解凍されて出現します。
PythonとRで分析する準備
PythonとRで分析する準備をします。
Pythonの基本的な準備
# Pythonの分析の準備
import numpy as np
import pandas as pd
import seaborn as sns
pd.options.plotting.backend = "plotly"
import rpy2
import rpy2.robjects as robjects
# Rを使えるようにする
%load_ext rpy2.ipython
Rの基本的な準備
※コメントのlibrary(openxlsx), library(DT)は必要に応じてコメントを外します
# Rの分析の準備
%%R
.libPaths("library") # libraryの保存先フォルダ指定
library(tidyverse)
library(readxl)
#library(openxlsx) # 必要に応じて実行
#library(DT) # 必要に応じて実行
# パッケージを保存していない場合、インストール(時間かかります)
# install.packages("openxlsx")
# install.packages("DT")
# install.packages("Rcpp") # 前提パッケージ
# install.packages("htmlwidgets") # 前提パッケージ
RとPython間でデータテーブルを移動する
以下のようにするとRとPython間でデータテーブルを移動できます。
RからPythonにデータ移動
# Rでデータを作成する(irisをコピーしてdf_rとする)
%%R
df_r <- iris
df_r %>% head()
# PythonからRのデータを読み込む
df_py = robjects.r("df_r")
print(df_py.head())
Python側からRで作成したデータフレームを読み込めました。
同様にPythonからRへのデータ移動もやってみましょう。
PythonからRにデータ移動
# Python側のデータフレームをRにインポート
%R -i df_py
R側からPythonのデータフレームを受け取ることができました。
今回は以上になります。