脳内ライブラリアン

脳内ライブラリアン

医療、統計、哲学、育児・教育、音楽など、学んだことを深めて還元するために。

MENU

【refer to】紹介された/~と呼ばれている【医学論文の英語表現】

前日にコーパスに基づいた英語表現の磨き方について書きました。

medibook.hatenablog.com

 

そこで、論文を書くときに探した医学論文で使われやすい英語表現を、ストックしていこうと思います。

 

「~より施設に紹介された患者」や「~と呼ばれている」といった表現として使える"refer"について書きます。

 

目次:

 

単語の意味と共起表現、クラスタ

refer~を言及する/参照する/紹介する、などの意味を持つ他動詞です。名詞形としてreference=引用文献としてもよく論文では使われます。

 

副詞・前置詞の共起表現ではas, often, sometimes, commonlyなどas以外には頻度を表す副詞と一緒に良く使われているようです。

 

クラスターとして上位に来るのはreferred to, referred to asといった前置詞との組み合わせ+過去分詞形です。

 

refer to~「~を参照にする」

refer A to B「AをBに紹介する」

refer to A as B「AをBと呼ぶ」という意味で使われます。

 

過去分詞形になるとA referred to as Bで「AはBと呼ばれている」となり、論文で専門用語を説明する際に汎用性が高いです。

 

実際の例をみてみます。

 

用例

nativeの書いた手持ちの論文から、上述の意味の用例を引用してみます。

 

refer A to B「AをBに紹介する」を用いた例です。

Twenty eight patients referred to our department between 1983-87 were included in this study.*1

紹介された患者について調べられたstudyのmethodですね。

 

続いて

refer to A as B「AをBと呼ぶ」の用例です。

MOG-IgG is now considered to denote a disease entity in its own right, distinct from classic MS and from AQP4-IgG-positive neuromyelitis optica spectrum disorders (NMOSD), which is now often referred to as MOG-IgG-associated encephalomyelitis (MOG-EM)*2

MOG-IgG抗体は独立した疾患概念で、MOG-EMとしばしば呼ばれている、という内容ですね。共起表現で上位だった"often"と絡めて使われています。

 

Holmes tremor is also referred to as rubral tremor or midbrain tremor.*3

ホームズ振戦が他にrubral tremor, midbrain tremorと呼ばれていることを示しています。

 

ちなみに「~を参照にする」という意味もあると書きましたが、「図3を参照」=refer to figure 3といった表現は避けた方が良いようです。

論文校正企業のサイトにそんな記事がありました。↓

指示の言葉として"See Table 2"、"Refer to Figure 6"は使わない | エディテージ・インサイト

まあ確かに論文読んでて()内に示してはありますが、わざわざrefer toと書かれているのはあまり見たことがないですね。

 

引用文献:

*1. Klockgether T, Schroth G, Diener H-C, Dichgans J, Germany W. Idiopathic cerebellar ataxia of late onset: natural history and MRI morphology. Vol. 53, Neurosurgery, and Psychiatry. 1990.

*2.Jarius S, Paul F, Aktas O, Asgari N, Dale RC, de Seze J, et al. MOG encephalomyelitis: international recommendations on diagnosis and antibody testing. Nervenarzt. 2018;

*3. Louis BED. By Elan D. Louis, MD, MS, FAAN. 2019;959–75.

 

論文の英語表現をコーパスを使って磨く方法

いざ文章を英語で書こうと思ったときに、適切な表現が分からず、書き方に困ることはよくあることかと思います。

 

自分の場合は論文を書くときにそういったことで良く困ってます。間違えると、内容以外の点でrejectの一因になってくるので切実です。

 

そこで、やられるのは他の論文や文章から役に立ちそうな表現を集めてきて、剽窃にならないように改変しつつ使うといったことでしょうか。

 

ここで困るのは単語同士の組み合わせです。他から表現を持ってきたは良いけれど、どれとどれなら組み合わせて使って良いのかが困る点であり、間違えることがあるところです。

 

「この組み合わせはおかしい!」と分かるようなネイティブの感覚は持ってないですし、Google検索で同様の表現があるか検索はできますが結構間違ってることも多いです。

 

そこで、今回は英語表現が正しいのかどうか、どんな組み合わせならば自然なのか、コーパス言語学を使ってそういったことが学習できる方法を紹介してみます。

 

目次:

 

そもそもコーパス(corpus)とは

コーパス言語学分野の専門用語で書き言葉や話し言葉を集めたデータベースのことを意味します。膨大な量の文章や話し言葉を集めることで、出てくる言葉の頻度・関係性などを分析し、言語の特徴の解明や、自然言語処理、書き手の特定、時代による言語の変化の研究等を行うことができます。

 

これが英語学習に何の役に立つのでしょうか。

 

例えば、日本語を知らない外国人が「ブログ」という言葉を使ってみたい、とします。「ブログを書く」「ブログをアップする」とは言いますが、「ブログを描く」「ブログをアップロードする」という表現は何となく使わないと思います。意味を解釈しようと思えばできますがどことなく不自然な表現です。

 

そこで、コーパスを用いて文章の頻度を検索すれば、明らかに後者の言葉の出現頻度は低いので、自然な表現ではないということが分かります。こういった頻度の比較はgoogle検索では十分にできません。また、「書く」「アップする」という表現を知らなくても、「ブログ」と関連しやすい動詞をコーパスで調べれば、そうした表現に気づくこともできます。これを英語で利用しよう、というのが今回の記事の目論見です。

 

世界初の英語コーパスは1964年に完成されたBrown Corpusとされており、100万語ほどでしたが、現在はインターネットとPCの普及もあり、データベースの構築がより容易となったため億単位規模のコーパスが多数存在しています。しかも、無料で使えます。*1

 

ちなみに、億単位の単語量のあるコーパスを構築するには言葉のどこまでをどのように収集するですが、多くの場合は”均衡的収集法”という方法が使われます。*1この方法では、まず大まかにジャンル毎で言葉の種類を層別化します。例えば、小説、新聞、雑誌、話し言葉、学術論文etc...。こうして作った層が大体言葉全体の何割を占めるか割り振ります。これを仮想の母集団として、統計学のごとく同じ割合になるように、各ジャンルから無作為に標本抽出をします。こうしてコーパスを作る方法が均衡的収集法と言われます。

 

続いて、造られたコーパスからどうやって英語表現を磨いていくかを具体的な方法を紹介していきます。

 

コーパスにおける用語説明

実際のコーパスを使っていくうえで知っておきたい用語を説明します。

コンコーダンス(concordance)

いわゆる用例と同じような意味です。コンコーダンス検索ということをすると、調べたい単語の入った例文がざっと並びます。調べたい単語が真ん中に並び、周辺に前後の文章が並ぶKWIC(keyword in context)形式と呼ばれる形で結果が出されることが多いです。

 

オンライン辞書でも例文はみられると思いますが、コーパスでは表示される量がはるかに多いのと、前後の文脈もより広くみられることが特徴です。端的な例文では正直使い方が分かりにくいことが多いので、そういった点ではコーパスに利点があります。

共起表現(collocates)

どの単語と単語が関連性が強いか(=一緒に用いられる頻度が多いか)を示すのがcollocatesです。ある語と一緒に用いられやすい言葉が分かります。文章中で隣接していなくても、3-4語離れていても検出したり、設定は色々です。

 

例えばreveal(~明らかにする)と言う単語だと、名詞ではstudy, analysis, difference,...などの単語が並びます。共起表現から、学術的に用いられやすい単語であることが分かりますね。

単語連鎖(clusters)

clustersは隣接して用いられる単語の塊を検出します。句動詞(different from~とか)は多くがこれで見つかってくると思います。

 

代表的なコーパス

実際に使えるコーパスを紹介します。

①Corpus of Contemporary American English (COCA)

Corpus of Contemporary American English (COCA)

2008年に構築されたアメリカ英語のコーパスです。語数は10億語に達しています(2020年現在)。上述した均衡的収集法を用いており、内容は話し言葉、小説、雑誌、学術論文、新聞、ウェブ、テレビ、ブログに分けられています。1年に2000万語追加され、年に2回更新され続けています。

例文もジャンルを表記してくれるので学術論文の表現を探したい自分にとっては役に立ちます。ちなみにこのリンクのサイトから他の代表的なコーパスにいけます。簡単な使い方は後述します。

 

iWEB

The iWeb Corpus

名前の通りウェブからのみ収集したコーパスです。収集された単語量は驚きの140億語!2200万以上のウェブページから集められています。こちらは均衡的収集法ではなく、ユーザー数の多いウェブサイトを色々ふるいにかけて集めているようです。

 

単語量が圧倒的に多くウェブが主体のため、ネットで書くような表現は参考にしやすいと思います。

 

③ライフサイエンス辞書

ライフサイエンス辞書

ちょっと例外ですが、日本のサイトも紹介します。生命科学系の分野のコーパス検索(コーパスというよりコンコーダンスな感じですが)ができ、文章のもとになった論文へのpubmedリンクも設定してあります。英語を書く対象が論文であれば役に立つと思います。

 

コーパスを活用してみよう

言語分析的な詳細な使い方はあまり分からない(というか必要でない)ので、COCAを例にして簡単な見方だけ紹介します。

 

まず上記リンクから飛ぶとこのような画面になります。

f:id:medibook:20200924223159j:plain

(https://www.english-corpora.org/coca/より引用)

まず①~③の部分を押して、そのあと下の空欄にいれると単語の検索ができます。

 

①はコンコーダンス検索です。文章中での使われ方がリストになってざっと並びます。スペースで区切って複数語も検索可能です。

②は言葉を学ぶうえではあまり使えませんが、ジャンルと年代ごとの頻度が分かります。

③は単語検索で、一語のみでの検索となります。画面が切り替わって共起表現や単語連鎖の検索ができます。(下図)

④はiWEBなどの別のコーパスに切り替えができます。

 

 

続いて、③の単語検索画面を見てみます。

f:id:medibook:20200924224022j:plain

(同HPより引用)

 

①は検索した単語です。先ほど例で出した"reveal"を入れてます。

②はジャンル毎の頻度がグラフ化されています。ACADは学術論文ですが、それが多いですね。

③TOPICSは単語があるところと同じウェブページ内に出てくる単語(同じ文章とは限らない)で頻度が多いものを挙げています。

④は上で説明した共起表現です。

⑤のリンクをクリックすると、共起表現や単語連鎖を見ることができます。

 

単語連鎖(クラスター)の検索画面はこんな感じです。

f:id:medibook:20200924224639p:plain

(同HPより引用)

青が濃いものであるほど頻度が高いです。一緒に使われる単語がパッと見て良く分かります。

 

単語同士の相性が統計的に整理された頻度をみてしっかりと確認できるので、論文を書く時の正しい表現を見つけるのにはうってつけです。例文に目を通すだけでも感覚が磨かれる感じもあるので、ぜひ英語で文章を書かないといけないような方は見てみることをお勧めします。どこまで効果があるかはまだ実証できてないので分かりませんが(笑)

コーパスから見つけた論文に使えそうな医学英語表現について、また記事にしていく予定です。

 

参考文献:

*石川慎一郎著『ベーシックコーパス言語学』 

明文化されない言語の特徴を学ぶ方法

前回論文英語の話を書きましたが、第二言語の学習において難しいのは、「明文化されない言語の特徴」をどう掴むかと言うことだと個人的には思っています。

 
先日紹介した医学論文英語の本ではcomfortable Englishの例として短く伝えることを原則としています。こういった規則性のある文法ではない「感覚のようなもの」をどう掴めばよいのか。ネイティブの方から見てもなんか変な文章、とは言えても、すぐさま理由を述べることが難しいこの「感覚」について、第二言語学習理論の本を読みながら、ちょっと考えてみました。
 
目次:

母語との違いをもとに考える対照分析仮説

日本語は言語学の分類からしても、一般的に考えても明らかに英語からは遠い言語です。文の形もS(主語)-V(動詞)-O(目的語)ではなくSOVが基本ですし、文字も違いますし、rとlの発音の違いは認識できないですし。
 
こうした言語間の違いを考慮せずに当てはめてしまうと、英語の「感覚」とは異なるものが出来上がってしまいます。和製英語をそのまま使ってしまうのも、この一例でしょう。
 
母語との違いを考慮せず、間違えてしまうこと」を重要視したのが対照分析仮説と呼ばれる理論です。この仮説では母語での例を当てはめてしまうことで第二言語学習者の間違いを指摘しようとします。
 
この説は非常に有力なように聞こえますし、実際英語学習の本でもこのような事を中心に書いてあるものもありますが、どうもこれだけでは説明できないようです。
 
というのも、異なる母語をもつ第二言語学習者(例えば中国人とフランス人が英語を学ぶ場合)で同じようなミスをすることが指摘できるからです。対照分析仮説に従えば、母語が違えば間違える事項は異なるはずですが、実はそうではなかった。
 
さらにはこの対照分析仮説は以前紹介した行動主義に則ったものであり、行動主義の批判と合わせて否定的な意見が出てくるようになります。
 
行動主義についてはこちらを参照ください。
 

第二言語の学習過程で形成されるのは中間言語

そこで代わりに出てきたのが中間言語仮説とよばれる理論です。

 

異なる母語をもつ第二言語学習者でも同じようなミスをしており、これはその第二言語母語として学ぶ幼児と同じタイプのものだったことが明らかになりました。

 

そこで1972年にLarry Selinker(現在はミシガン大学言語学教授)は中間言語(interlanguage)という概念を提示しました。この言語は第二言語学習者の中で成立するルールで構成されており、母語とも第二言語ともルールが異なる、というものです。いわば自分ルールの言語というところですね。

 

ただ、この中間言語はあくまで自分ルールになってしまうため、フィードバックが得られないとそのルールが固定され、化石化(fossilization)してしまう、と言う問題点があります。

 

では、この自分ルールをどうやって第二言語のルールに近づけるのか。

 

中間言語をどうやって第二言語に近づけるか

その都度自分の第二言語をフィードバックしてくれるネイティブスピーカーがいれば最強だと思いますが、そんな人は残念ながらいません。

 

そうなると自分でネイティブの書いたor話した第二言語からインプットするしかないですよね。その際の注意点について考えてみました。

 

①違いに自覚的になる

自分の使っている中間言語とネイティブの第二言語との違いに敏感にならないといけません。どこがどう違っていて、またそれはなぜなのか。特に「意味を知っている」と思っている単語の使い方や文章の構成ではより自覚的にならないと気づけないと思います。

 

例えば、知っている単語であるはずの前置詞ひとつの使い方にしても、意外と知らないことが結構あります。以下の文の前置詞の間違いを指摘できるでしょうか。

 

There were no significant differences of the shapes and sizes of fins between the two species.

(その2種の鰭には、形にもサイズにも有意差は見られなかった。)

(『英文校正会社が教える 英語論文のミス100』より引用)

 

 

 

 

ここではdifferencesのあとには"of"ではなく"in"が入ります。"of"程度の違いを述べるときに使われ、"in"特徴の違いを示すときに使われます。

 

なぜ、ここで、この前置詞なのか、読むときには気になりませんが、いざ書くとなると問題となってきます。必要なのはこういった差異をある程度知っておき、読む際にも自覚的になることだと思います。

 

②イメージを用いる

言葉で説明しようとすると母語第二言語で共通した感覚をつかめないので、イメージを使う。これも一つの方法だと思います。
 

例えばこの辺の本は、最近書店でもよくみますが、前置詞をイメージでつかむというものですね。単語間の細かい違いや前置詞といった他のものと組み合わせて使うものは言葉で説明しきれない部分がどうしても出てくるので特にイメージが重宝します。また、画像は記憶にも残りやすいという利点もあります。

 

③文化的背景を知る

話されている言語の文化的な背景が分からなければ、意味をとることができない言葉は多数あります。

 

最近のスローガンでいうと"Black lives matter"は日本語に訳しにくいので、今もそのまま使われています。過去の歴史と文化的な背景をもとに叫ばれているため、日本語で「黒人の命は大切」といっても何だかちぐはぐな感じがしてしまいます。

 

実際、文化的な背景を知るということは、言語学習の効率を上げるうえでも有用です。金銭や仕事上での必要性をモチベーションとする道具的動機付けよりも、その言語を話す外国人や文化に好印象をもつことによる統合的動機付けの方が学習に成功しやすいともいわれいます。まあ、言語学習に成功しているから好印象をもっているという逆の関係である可能性もありますが。

 

ただ、経験的にも文化的に好印象を持っているほうが、言語学習に成功するという例には枚挙にいとまがないわけで、「アニメが大好きすぎて日本語が流暢な外国人」とか「韓国ドラマが好きで韓国語しゃべれるようになった日本人」とか一杯いるわけですね。そして、最たるものが「外国人の彼女/彼氏を作る」でしょうか。

 

 

昔図書館で数学者かつ多言語習得者であるピーター・フランクルの本を読みましたが、この人はまさに女の子と喋ることが多言語習得の最良の方法と勧めていましたね(笑)妻子持ちとなった今やできませんが、単身のかたは是非試してみていただきたいです。

 

コーパス言語学

あともうひとつ、個人的に興味がある手段はコーパス言語学というものです。これは言語の中で使われる単語の種類や頻度、共起表現(どの単語が一緒に用いられやすいか)を統計学的に解析して特徴を探し出す方法論です。いわばネイティブが単語をどう用いるかの感覚を統計的に暴き出すわけですね。これを用いた単語帳とかも時々見かけます。

 

論文英語とか結構使う表現似通ってるじゃんと思うので、頻出単語を集めて使い方を解析していけば面白いんじゃないかなと思ってます。コーパス言語学で学ぶ神経内科の論文英語」なんてくそマニアックな本は何十年たっても出ないと思うので、自分でやってみたいところですね。

 

 

ちなみにコーパス言語学に則った一般的に使うアメリカ英語のデータベースなんかはこちらに収集されています。使ってみると面白いと思います。

Corpus of Contemporary American English (COCA)

 

 

参考文献:

 

 

 

論文をrejectされた記念に、症例報告の書き方の本を紹介する

先日出したケースレポートが無事にrejectされました(泣

 

英文の症例報告はまだまだ初めてであり、超大手ジャーナルだったので、仕方ないと思ってますが、残念な気持ちにはなりますね。

 

査読者からも示唆に富むコメントが結構もらえたので、ひとまず出して良かったです。

 

ただ、、やっぱりちょくちょく査読者のコメントにみえてくるのが、「英語の文法ちょっと気になります」の声。

 

そこで、悔しさのあまり症例報告(英語論文の書き方を含む)の書き方の本を追加で買ったのでまとめて紹介します。

 

目次:

 

 

松原茂樹著『論文作成ABC:うまいケースレポート作成のコツ』

自治医科大学産婦人科の教授が書かれている本です。表紙に「大漁の旗」がありますが、ケースレポートとは魚を網で囲って集めて(意味のある知見を見つけ出す)→大海へ放つ(一般化する)というイメージをもとに、ケースレポートとはどういう意味があるものなのかを定式化して、説明しています。意味のある知見を2つは見つけ出そう、という「2つ分かった法」なんかもケースレポートの定式化として非常に分かりやすいです。あとはintroduction~discussionまで論文の構成を、実際の著者の英語論文を出しながら、ひとつひとつ丁寧にみており、英文ケースレポートについてはこの1冊が一番だと思います。

 

國松淳和著『はじめての学会発表 症例報告: レジデントがはじめて学会で症例報告するための8scene』

南多摩病院の膠原病内科の先生が書かれた本ですね。これはタイトルの通りで「はじめてレジデントが(国内の)学会発表する」ための本です。準備~抄録~発表までマンガ形式で学べます。どういった点の内容に注意するか、間違った例と修正例も並べて書いてあります。平易で読みやすいですが、あくまで「はじめてのレジデント向け」ではあります。学会発表を命じられた研修医が最初に買う一冊としては適切だと思います。

 

植村研一著『うまい英語で医学論文を書くコツ』

脳神経外科医であり、現在は浜松医科名誉教授、日本医学英語教育学会名誉理事長の植村先生による一冊です。1991年に初版が出された本でありながら、なんと昨年2019/10に改訂。native speakerにとっての気持ちのいい英語"comfortable English"とはどんなものなのか、後半では100本ノックと称して大量の実例(書かれた例→訂正例)を交えながら、説明されています。
この"comfortable English"というのが、医学論文に限らず結構大事な概念だと思います。例えば、日本語を結構流暢に話せる外国人をみたときに、「文章で書いてみるとなんか気になる表現」とか「ちょっと場にそぐわない言葉」とかある程度は伝わるんだけど、何か"comfortable"でない表現というのもあると思います。これって中々言語化できるものではないので、学びにくく、これこそが言語独特の難しさになっているのかなと思います。
本書ではとにかく論文英語の本質は「短く伝える」こととして、より短い表現かつ伝わりやすい表現を中心に説明しています。確かに英語で書かれたものをみたときに「なんでこんな書き方にするんだろう」と思ったりもしますが、そう感じる点こそが実はポイントだったりするわけですね。
英語で論文を書く人にぜひ読んでもらいたい一冊です。
 

谷本哲也著『生涯論文!忙しい臨床医でもできる英語論文アクセプトまでの道のり』

大学勤務ではない一般の臨床医でありながら多様な分野にわたる論文を大量に書かれている谷本先生の書かれた本です。一般臨床医でもこれだけ論文が書けますよ、というアイディアの詰まった本で、各ジャーナルの特徴の話から症例報告・臨床研究のアイディア、統計、論文不正、共同研究の仕方、論文の書き方、投稿先の選び方、と著者の広い経験をもとに、とにかく幅広い経験的知識が紹介されています。レターやオピニオンを書いてみよう、という発想や他の分野の先生との協力というのも、あんまり今まで考えたことがなかったので、論文やジャーナル、研究との向き合い方が変わるという意味でお勧めしたい一冊です。
 

エディテージ著『英文校正会社が教える英語構文のミス100』 

これはエディテージという英文校正の企業が出した本で、医学論文に限らず論文全般の英語のミスについて書かれた本ですね。生命科学分野も一応入っています。上述の本にも出てきますが、ネイティブでないと難しい冠詞の話や、個人的にはよくわかっていなかった「コロン」「セミコロン」「カンマ」の使い方など実際に日本人がつまづきやすい=校正されることの多い内容を紹介してくれているので、tipsの詰め合わせではありますが、勉強になりました。中には、「え、これは基礎文法事項じゃないの」と思ったりする内容があるのと、そもそもの論文全般の書き方の話も多いので医学分野に特化しているわけではない分、医師の自分にとっては読まなくても良い箇所も多かったです。
 
 
一通り読んだらまた論文へのモチベーションは上がったので、再度また頑張ります。

現代数理統計学の基礎 3章 問15

平方変換の問題シリーズです。問14は結構簡単なので飛ばして、問15をやります。

 

これがちょっと厄介なんですね。

 

問12の記事で書いたように分布関数から考えるとY=X^2の平方変換をする場合

F_Y(y)=P(Y\leq y)\\=P(X^2\leq y)\\=P(-\sqrt y\leq X\leq\sqrt y)

となることから、両辺を微分して

f_Y(y)=\{f_x(\sqrt y)+f_x(-\sqrt y)\}\frac{1}{2\sqrt y}dy

となることが本書内では命題となっていました。

 

ただし、ここで問題なのはxの範囲が非対称である場合。

上記の式における

P(X^2\leq y)\\=P(-\sqrt y\leq X\leq\sqrt y)が成り立たなくなります。

問15では-1<x<2なので、-1<x<1の範囲では上記の式が成り立ちますが、1<x<2においてはxが-2~1の値をとれないために、上記の式が成り立ちません。

 

よって、場合分けをして考える必要があります。

-1<x<1(0<y<1)においては上記の式を使って

[tex:f_Y(y)=\{f_x(\sqrt y)+f_x(-\sqrt y)\}\frac{1}{2\sqrt y}\\=\frac{\frac{2}{9}(\sqrt y+1-\sqrty+1)}{2\sqrt y}\\=\frac{2}{9\sqrt y}

 

続いて1<x<2(1<y<4)においては元の式に立ち戻って

F_Y(y)=P(Y\leq y)\\=P(X^2\leq 1)+P(1\lt X^2\lt y)\\=\int_{-1}^{1}\frac{2}{9}(x+1)dx+P(1\lt X\lt \sqrt y)\\=\frac{4}{9}+\int_{1}^{\sqrt y}\frac{2}{9}(x+1)dx\\=\frac{2}{9}(\frac{1}{2}+\sqrt y+\frac{y}{2})

 

これを微分して

f_Y(y)=\frac{1}{9}(\frac{1}{\sqrt y}+1)

となります。

 

応用問題解くには原義まできちんと理解することが大事ですね。

現代数理統計学の基礎 3章 問13

前日の問12とほぼ似通った問題ですが、絶対値を使った点がやや難しいのが問13です。こちらも参考にしながらどうぞ。

現代数理統計学の基礎 3章 問12

 

 

まず(1)。

これは問12とほぼ同様のやり方でできます。

M_X(t)=\int_{-1}^1\frac{e^tx}{2}dx\\=\frac{e^t-e^{-t}}{2t}

 

あとは期待値、分散は問12と同様にモーメント母関数を使いつつ工夫してやるか、普通に定義を当てはめてやればでます。普通に当てはめるほうが簡単です。

 

(2)は平方変換です。今回はxの値が-1~1ということで、対称性があります。

よって全てのyにおいて、f_X(y)=f_X(-y)が成り立つことを活用します。

f_Y(y)=\{f_X(\sqrt y)+f_X(-\sqrt y)\}\frac{1}{2\sqrt y}\\=\frac{f_X(\sqrt y)}{\sqrt y}\\=\frac{1}{2\sqrt y}

となります。

なので、問12の(2)と全く同じ答えです。

 

厄介なのは(3)。

対数変換ですが絶対値がついていますので、場合分けをする必要が出てきます。

まず、e^{-y}=|x|, |\frac{dx}{dy}|=e^{-y}です。

 

変数変換の際にかける\frac{dx}{dy}は本書内での説明でもある通り、絶対値付きなので、xの符号によらずこれは変わりません。

 

ここで、-1<x<0のとき、x=-e^{-y}(0\lt y\lt\infty)

また0<x<1のとき、x=e^{-y}(0\lt y\lt\infty)

となります。

 

ここで定義関数I(0<y<∞)を使って表すと(定義関数は値の条件を満たさなければ0になり、条件を満たせば1になる関数)

f_Y(y)=f_X(-e^{-y})e^{-y}I(0\lt y\lt\infty)+f_X(e^{-y})e^{-y}I(0\lt y\lt\infty)\\=2f_X(e^{-y})e^{-y}I(0\lt y\lt\infty)(対称性のため)\\=e^{-y}I(0\lt y\lt\infty)

となります。

 

よって実は問12の(3)と全く変わりませんので期待値と分散も1となります。

 

(4)もほぼ解き方が変わりませんので省略します。

 

結構色々やると慣れてきますね。平方変換シリーズのなかでもう一つ癖がある問15を次はやります。

現代数理統計学の基礎 3章 問12

今回は一様分布と平方変換についての問題です。

 

(1)はまず一様分布のモーメント母関数を求めます。これは式通りやるだけです。

 

平均と分散ですが、モーメント母関数から求めようとすると結構やりにくいので、解答という意味で行けば単純に定義から求めた方が楽にできます。

 

E[X]=\int_{0}^{1}xf(x)dx\\=[\frac{x}{2}]_0^1\\=\frac{1}{2}

 

分散はX2乗の期待値をまず求めて

E[X^2]=\int_{0}^{1}x^2f(x)dx\\=[\frac{x^3}{3}]_0^1\\=\frac{1}{3}

 

あとは計算します

V(X)=E[X^2]-\{E[X]\}^2=\frac{1}{12}

 

公式の解答ではテーラー展開を用いて行っています。本の第1章ではロピタルの定理を用いてM'x(0)を求めています。このようにモーメント母関数を使う場合はどちらかを使わないと求められないので注意が必要です。

 

続いて(2)。平方変換の問題です。

 

平方変換の際の確率密度変数はどうなるか。本書内の命題の通りに計算すればできます。

 

命題の内容について簡単に復習すると、まず

Y=X^2より\sqrt Y=Xです。

よって

dx=\frac{1}{2\sqrt y}dyとなります。

 

ここで、分布関数F_Y(y)と考えると

F_Y(y)=P(Y\leq y)\\=P(X^2\leq y)\\=P(-\sqrt y\leq X\leq\sqrt y)

となります。

この際注意が必要なのが、xの値域によってはこの変形ができない場合があることです。続いての3章問13がこの例にあてはまりますので、また次回あたりで確認します。

 

F_Y(y)=P(-\sqrt y\leq X\leq\sqrt y)=\int_{-\sqrt y}^{\sqrt y}f_x(x)dx

両辺を微分して

f_Y(y)=\{f_x(\sqrt y)+f_x(-\sqrt y)\}\frac{1}{2\sqrt y}

となります。

 

これを用いて

f_Y(y)=\frac{1}{2\sqrt y}

あとは平均と分散をそのまま計算していくだけです。

 

(3)はlogへの変換。

y=-logx, e^{-y}=x, \frac{dx}{dy}=-e^{-y}となります。

これは本書内の変数変換の命題を用いて

f_Y(y)=f_X(e^{-y})|-e^{-y}|\\=e^{-y}(0\lt y\lt\infty)

となります。

 

よって

E[Y]=\int_0^\infty ye^{-y}dy\\=\Gamma(2)\\=1

期待値は実はガンマ関数になることが分かると簡単に答えが出ます。

同様にして

E[Y^2]=\int_0^\infty y^2e^{-y}dy\\=\Gamma(3)\\=2

よって

V(Y)=2-1=1

となります。

 

(4)は尺度変換です。

X=\frac{y}{\sigma}-\frac{\mu}{\sigma}, \frac{dx}{dy}=\frac{1}{\sigma}

ですね。

よって先ほどと同様に

f_Y(y)=f_X(\frac{y}{\sigma}-\frac{\mu}{\sigma})・\frac{1}{\sigma}\\=\frac{1}{\sigma}(\mu\lt y\lt\sigma+\mu)

となります。

これもあとは普通に期待値と分散の定義に沿って計算するだけです。

 

単変数変換の良い練習になる問題ですね。