Dr.Clover’s Computer Clinic

[R]{graphics}stripchart() : 1次元散布図を描画する関数

説明 stripchart()は引数で指定されたデータに基き、１次元散布図（あるいは１次元ドットプロット）を描画する関数である。これらの図は標本数が少ない場合は箱ひげ図(box plots)のよい代替となる。使用法 Default ...

2017.04.12

{graphics}

Wilcoxon rank-sum test

同義語 Mann-Whitney test、Mann-Whitney-Wilcoxon test 定義 Wilcoxon rank-sum testは２群のt検定(two-sample t-test)のノンパラメトリック版である。 ...

2017.04.12

仮説検定

符合検定(sign test)

定義 sign testは、one-sample t-testのノンパラメトリック版である。帰無仮説(H0)：標本の中央値mxは、比較対象の中央値Mと等しい。帰無仮説の元では、Mより大きい標本の数と、Mより小さい標本の数は...

2017.04.12

仮説検定

q値 (q-value)

定義 q値とは、ある検定結果が有意と判断される最小のFDR(false discovery rate)値のことである。例えばq=0.01を有意とみなすことは、q<=0.01である複数の検定（多重検定）全体のFDRとして最大0...

2017.04.11

仮説検定

FWER (family-wise error rate)

定義 FWER (family-wise error rate)とは、多重検定において、１回でもαエラーを起こす確率のことである。例えば1000回の多重検定を行なう際のFWERが0.05であるとすれば、1000回の検定のうち1回で...

2017.04.11

仮説検定

FNR (false nondiscovery rate)

定義 FNR(false nondiscovery rate)とは、多重検定において、下した全てのnegative inference（有意差なしと判断した回数）の中で誤っている判断の割合のことである。 FDR = 誤ったnegat...

2017.04.11

仮説検定

FDR(false discovery rate)

定義 false discovery rateとは、多重検定において、下した全てのpositive inference（有意差ありと判断した検定結果）の中で誤っているものの割合のことである。 FDR = 誤ったpositive in...

2017.04.11

仮説検定

検出力(power)

同義語検定力、検出力、power、statistical power 感度(sensitivity) 定義検出力(power)とは、検定において、データが対立分布(HA)から抽出されている場合に、適切に帰無仮説(H0)を棄却...

2017.04.11

仮説検定

pooled variance

同義語 pooled variance, combined variance, composite variance, overall variance $ s_{p}^{2} $と表記される。定義複数の母集団が存在する...

2017.04.11

仮説検定

Cox回帰における残差

生存分析のデータには打ち切りデータが含まれているため、その残差分析は一般線形回帰モデルの残差分析に較べて複雑である。生存時間分析における残差には複数の種類（定義）がある。代表的なものは以下である。マルチンゲール残差(ma...

2017.04.11

生存時間分析

箱ひげ図(box plots)

定義箱ひげ図(box plots)はデータの分布を視覚的に表現する図の１種である。箱ひげ図では以下の数値が表現される。 25th パーセンタイル＝lower quartile (Q1) 50th パーセンタイル＝medi...

2017.04.11

記述統計(1変数)

訴追者の誤謬(prosecutor’s fallacy)

定義訴追者の誤謬(prosecutor's fallacy)とは、「p値とは帰無仮説(H0)が真である確率である」という誤解のことである。法廷の議論で頻出する間違いであるためこの名前がある。 p値は帰無仮説(H0)が真でと仮定...

2017.04.11

仮説検定

対立分布(alternative distribution)

定義対立分布(alternative distribution)とは対立仮説を具体化した分布。帰無分布の形を保ったまま、推定する効果量に応じて位置をシフトさせた分布を想定することが一般的である。関連効果量

2017.04.11

仮説検定

帰無分布(null distribution)

定義帰無分布とは帰無仮説(null hypothesis : H0)を具体化した分布のことである。検定の理論は、実測値が帰無分布上のどこに位置するのかを求め、実測値と同じあるいはそれ以上の外れ値が出現する確率をp値として返すとい...

2017.04.10

仮説検定

正規分布(normal distribution)

同義語 Gaussian、bell-shaped distribution 関連標準正規分布

2017.04.10

連続分布

エラーバー(error bars)

定義エラーバー(error bars)とは、統計学的推定における不確実性を視覚的に表現する方法１つである。伝統的に頻用される図であるが、その解釈は非直観的なものであり、取扱には注意を要する。エラーバーの種類エラーバーには３つの種...

2017.04.10

推定

Jetpackの連携エラー(xmlrpc.php)

Jetpack(4.8.2)をWordpress.comに連携しようとすると以下のエラーが出るようになってしまった。昨日まで順調に動いていて思いあたる原因はない。。エラーメッセージを文字起こしすれば以下の通り。エラー詳細...

2017.04.10

WordPressプラグイン

Jetpackのエラーの原因を調べる方法（デバッグ）

WordPressでJetpackが上手く動作しない場合、原因を調べる（デバッグする）方法がいくつかある。 (1) Jetpackのサイトからデバッグを実行する方法(Jetpackデバッガサイト）上記サイトにア...

2017.04.09

WordPress本体

Windows10でcurlを使用する方法

Windows10でcurlコマンドを使用するにはまずインストール作業が必要となる。 Window版Curlの入手とインストールこちらのサイトから入手できる。上記サイトではWindows以外のOS(Unix系、MACなど)用の...

2017.04.09

Windows10

VIF(variance inflation factor)

同義語分散拡大要因(variance inflation factor ; VIF) 定義 VIF(X) = 1/(1 – R^2) VIF(variance inflation factor)は多重共線性(multicoll...

2017.04.06

重回帰分析

等分散性(homoscedasticity)

定義等分散性(homoscedasticity)とは、誤差（残差）の分散が一定である(constant noise variance)という性質あるいはその仮定のことである。一般線形モデル(general linear mode...

2017.04.06

一般線形モデル

[R]{base} diff() : lagged differencesあるいはiterated differencesを計算する関数

説明ラグド階差(lagged differences)ないし繰り返し階差(iterated differences)を返す。使用法 Default S3 method: diff(x, lag = 1, differences ...

2017.04.06

{base}

[R]{coin} independence_test() : random permutation testを実行する関数

説明 independence_test() は任意の尺度で測定された２群の変数の独立性を検定する関数である。使用法 S3 method for class 'formula' independence_test(formula,...

2017.04.06

{coin}

[R]{base} by() : データフレームに含まれる各グループごとに集計関数を実行する関数

説明 by()関数は、tapply()をデータフレームに適用するオブジェクト志向のラッパーである。複数のグループのデータを含むデータセットがある時に、各グループごとに集計関数を実行する関数である。例えば男と女からなるデータがある時...

2017.04.06

{base}

[R]{stats}rlnorm() : 対数正規分布に従う乱数を生成する関数

説明平均＝対数平均、標準偏差＝対数標準偏差である対数正規分布に従う乱数を生成する。使用法 rlnorm(n, meanlog = 0, sdlog = 1) 引数 n : 生成する乱数の数 meanlog, sdlog : ...

2017.04.06

{stats}

パラメトリック検定(parametric test)

定義パラメトリック検定とは、データの分布に仮定をおく検定手法の総称である。検定には、データの分布に仮定をおくものとおかないものがある。データの分布におく仮定とは例えば、データが正規分布に従うというような仮定である。

2017.04.06

仮説検定

放射線治療専門医受験記（化学療法まとめ）

臓器別ケモのあらましをまとめる。胸部領域シスプラチンが要であろう。縦隔腫瘍(胸腺腫、胸腺癌、胚細胞腫瘍): シスプラチンを中心とした多剤併用肺癌(NSCLC): プラチナダブレット肺癌(SCLC:LD...

2017.04.04

医学備忘録

頭頸部がんの頚部リンパ節とは具体的にどこなのか？（鎖骨上窩リンパ節は頚部リンパ節である）

UICC TNMでは上咽頭、甲状腺以外のリンパ節転移の分類は共通であるが、「所属リンパ節は頚部リンパ節である」とあっさりとした記述があるのみ。具体的に頸部リンパ節の範囲の定義はUICCの中には見当たらない。日本のがん登録では...

2017.04.04

医学備忘録

放射線治療専門医受験記（TNMと解剖まとめ）

TNM 鎖骨上リンパ節乳癌ではN3c(最悪) 上咽頭癌ではN3b(最悪) 肺癌ではN3(最悪) 食道癌では遠隔転移！食道癌、直腸癌のT因子食道癌は「粘・筋・外・周」直腸癌は「粘・筋...

2017.04.04

医学備忘録

[R] Rprofile.site : R起動時に自動実行されるコマンドを記述するファイル

Rprofile.siteはRの起動時に自動実行されるコマンド（スクリプト）を記述するファイルのことである。通常Windows環境では、 C:\Program Files\R\etc\ に格納されている。この他に...

2017.04.02

R言語

[R] .RData : Rのワークスペースを保存するファイル

Rにはワークスペース（Rのメモリにある全てのオブジェクトとデーターの総称）を保存する機能がある。ワークスペースを保存する場合、.RDataという名前のファイルで保存される。

2017.04.02

R言語

[R]{utils} help.start() : Rのハイパーテキスト版文書を表示する関数

説明ハイパーテキスト（現時点ではHTML)版のRオンライン文書を表示開始する。使用法 help.start(update = FALSE, gui = "irrelevant", browser = getOption("brow...

2017.04.02

{base}

[R]{base} c() : 複数の引数を１つのベクトルあるいはリストに結合する

説明 c()は引数を結合するジェネリック関数(generic function)である。デフォルトメソッドは、引数を結合したベクトルを返す。全ての引数は返り値の型に型変換される。その際、namesを除く全ての属性(attribut...

2017.04.02

{base}

[R] パッケージとは

RのパッケージとはRに機能を追加するアドオンのことである。 Rのパッケージには２種類ある。 base packages : Rが起動時に自動で読み込むパッケージ contributed packages ：ユーザーが使...

2017.04.02

R言語

[R]{base} getOption() : Rのグローバルオプションの設定値を取得する関数

説明 getOption()はRが計算処理を実行しその結果を出力する方法を変更するグローバルオプションの値を設定したり取得する関数である。使用法 getOption(x, default = NULL) 引数 x : オプション...

2017.04.02

{base}

[R] rma(),lm(),lme(),lmer()の違い

metaforプロジェクトの記事のエッセンスをまとめる。メタアナリシスモデル(meta-analytic model)は、線形(混合効果)モデル linear(mixed-effects)model の特殊形である。メタアナリシスモ...

2017.03.30

メタ分析

サンプルの分散(sample variance)とサンプリングの分散(sampling variance)

同義語日本語訳としていずれも定まっていないが、sampleとsamplingを明確に区別することが必須である。そのためここではsampleを"サンプルの"、samplingを"サンプリングの"と直訳した。定義 Sample var...

2017.03.30

標本分布

time-varying exposure

定義 time-varying exposureとは、疫学研究における曝露の中で、同一対象に対する曝露状況が経時的に変化する（しうる）曝露のことである。例えば、ある時期には薬を飲んでいたが別の時期には飲んでいないというような状況における内...

2017.03.30

生存時間分析

[R]{survival}cluster() : 生存時間分析のモデル式の右辺の中でクラスター（相互関連する観察データのグループ）を指定する関数

説明 cluster()は生存時間分析の文脈で、モデル式の右辺の中でクラスター（＝相互関連する観察データのグループ）を指定する関数である。モデル式中でcluster()を使用することは、頑健サンドイッチ分散推定（robust sandwi...

2017.03.30

{survival}

[R]{stats}duplicated() : ベクトル内の重複要素やデータフレーム内の重複行を検出する関数

説明 duplicated()はベクトルやデータフレームの要素を先頭から順に調査していき、重複する要素に対してはTRUE、重複していない要素にはFALSEを返す関数である。 anyDuplicated()はany(duplicate...

2017.03.30

{base}

[R]{stats}rbinom() : 二項分布に基づく乱数生成を行う関数

説明 rbinom()は二項分布に基づく乱数生成(random generation)を行う関数である。使用法 rbinom(n, size, prob) 引数 n : 生成する乱数の数 size ：試行回数（ゼロ回以上）pr...

2017.03.30

{stats}

ロジット(logit)

定義ロジット（Logit）とは、0から1の値をとるp に対し、以下の式で定義される値である。 logit(p) = log {p / (1-p)} = log(p) - log(1-p) 対数の底は1より大きければ何でもよい。 ...

2017.03.30

ロジスティック回帰分析

[R]{stats}rnorm() : 正規分布に基づく乱数生成を行う関数

説明正規分布に基づくランダム偏差(random deviate)を指定した数だけ生成する(random generation)。使用法 rnorm(n, mean = 0, sd = 1) 引数 n ：生成するランダム偏差の...

2017.03.30

{stats}

ネストしたモデル(nested model)

定義２つの統計モデルがある時に、一方のモデルに含まれる説明変数のセットが他方のモデルの説明変数の部分集合になっている時、この２つのモデルをネストしたモデルと呼ぶ。全ての説明変数を含むモデルを飽和モデル(saturated mod...

2017.03.29

モデル選択

対数尤度(log likelihood)

定義対数尤度(log likehood)とは尤度(likelihood)の対数のことである。わざわざ尤度（ないし尤度関数）の対数を取るのは、そうすることでその後の数式処理が楽になるからである。具体的には尤度関数は積の形で表される...

2017.03.29

重回帰分析

[R]{stats}influence.measures() : 外れ値削除法による回帰診断を実行する関数

説明 influence.measures()は、線形回帰分析モデルおよび一般化線形回帰分析モデルに対して、外れ値削除法による回帰診断を実行する関数である。Belsley, Kuh and Welsch (1980), Cook and ...

2017.03.29

{stats}

[R] RStudioでヘルプのフォントサイズを変更する方法

RStudioではヘルプペインにヘルプが表示されるが、このフォントが小さく非常に読みにくい。ヘルプの文字を拡大する方法を調べてみたが、どうやらヘルプペインのフォントだけを変更する方法はない（2014年に既に開発者に問いかけがなされているが、...

2017.03.29

RStudio

subdistribution hazard

定義 subdistribution hazardとは、ある主体が競合リスク存在下において、ある原因（リスク）によるfailureを起こすハザードのこと。 subdistributionは競合リスク分析の鍵となる概念である。関連...

2017.03.29

生存時間分析

[R]{survival}tmerge() : time varying covariateを含むデータセットを作る関数

説明 tmerge()はtime-dependent variableを含むデータセットを作る関数である。使用法 tmerge(data1, data2, id, ..., tstart, tstop, options) 引数 ...

2017.03.29

{survival}

メタ分析 (meta-analysis)

同義語メタアナリシス、meta-analysis 定義メタアナリシスとは、同一のテーマを扱う複数の研究結果を集約・対比することを目的とする、統計学的方法に裏打ちされた系統的文献レビューのことである(Glass 1976)。メタ...

2017.03.29

メタ分析

1…4 567 8…34