|| 調べるとズレちゃうって感じの話
これは「測定誤差」の話でもあり、
『同時に決まらない』ことを示すものでもあります。
スポンサーリンク
目次
不確定性原理「同時に確定しない」
コンプトン効果「X線と電子の衝突」
見る「観測における基本中の基本」
測定での変化「位置と運動量とか」
ロバートソンの不等式「不確定性関係に関わる式」
不等式のアプローチ「作る手順」
交換子の不等式「スカラーだと 0 になるけど」
統計と物理量「不等式を作る指針」
二次方程式「交換子が出てくるもの」
不等式を作る「材料と手順のまとめ」
小澤の不等式「不確定性関係の厳密な式」
測定と交換子「同時固有状態を使う測定」
交換子の式変形「取り出したいやつを取り出す」
具体的な形「位置と運動量をぶち込んでみる」
測定誤差と擾乱「厳密な定義」
不確定性関係
|| 片方の誤差が減ると片方が乱れる
これは『同時に決まらないものがある』
ということを保証する式です。
\begin{array}{llc} \displaystyle ε_x η_p&\displaystyle ≥\frac{ℏ}{2} \\ \\ \displaystyle ε_q η_p+ η_pσ_q+σ_pε_q &\displaystyle ≥\frac{ℏ}{2} \end{array}
慣例としては、
ε が『測定誤差』を表す記号になります。
x は『位置』で p は『運動量』です。
加えて、
σ は『標準偏差(量子ゆらぎ)』を
η は『擾乱』を表しています。
現時点で意味分かんないのは普通のことなので、
今の時点ではぼやっと覚えておきましょう。
まあともかく、数式的にはこういう感じです。
詳しくはこれから話していきます。
測定による物理量の乱れ
「位置を調べるため」に何をするのか。
「運動量を調べるため」に何をするのか。
こういうことを考えてみると、
この2つが『同時に決められない』
ってことがなんとなく分かります。
どういうことかというと、
例えば「電子の位置を調べる」なら、
どこにあるか調べるために、
『光子などをぶつける』必要がありますよね?
まあつまり、
「位置はズレる」し「動きも変わる」わけで、
\begin{array}{rlc} \displaystyle Δ x&≒λ \\ \\ Δp&\displaystyle ≒\frac{h}{λ} \end{array}
結果としてその「ズレ」がこのようになってると、
Δx を小さくすればするほど、
Δp が大きくなることがわかります。
コンプトン効果
「 X線 」が『電子に衝突した後』
「波長が長くなる」現象
これをコンプトン効果と言います。
「光の粒子性」を示す実験結果の一つです。
\begin{array}{rlc} p&=mv \\ \\ E&=mc^2 \\ \\ E&=\displaystyle hν \\ \\ &\displaystyle =h\frac{c}{λ} \\ \\ \\ \displaystyle pc&\displaystyle =h\frac{c}{λ} \\ \\ p&\displaystyle =\frac{h}{λ} \end{array}
記号を整理しておくとこんな感じで、
「波長 λ 」を使ってこの効果を表すと、
\begin{array}{rlc} \displaystyle λ^{\prime}-λ&\displaystyle =\frac{h}{m_e c}(1-\cos θ) \\ \\ \end{array}
結論はこうなります。
角度 θ は「電子に衝突して変化した角度」で、
質量 m_e は「電子の質量」ですね。
意味分かんないと思いますが、
これは「光は粒子じゃね?」の根拠の1つです。
加えて、
『測定』での「電子の位置の変化」
「電子の持つ運動量の変化」の根拠にもなってます。
コンプトン効果の導出
「位置・運動量の変化」を理解するために、
これを『導く手順』を紹介しておきます。
使うのは「エネルギー保存則」と
「運動量保存の法則」です。
\begin{array}{rlc} \displaystyle E&=hν \\ \\ &\displaystyle =\frac{hc}{λ} \\ \\ \\ p&\displaystyle =\frac{hν}{c} \\ \\ &\displaystyle =\frac{h}{λ} \end{array}
整理しておくと、
まず「X線」のエネルギーと運動量がこうで、
\begin{array}{rlc} \displaystyle E&\displaystyle =\frac{1}{2}m_e v^2 \\ \\ p&=m_e v \end{array}
「電子」のエネルギーと運動量はこうです。
んでこれらの「衝突のイメージ」なんですけど、
これはあれです。ビリヤードとかビー玉とか、
なんかそういうのをぶつける感じで、
その時の玉の挙動をイメージしてもらえれば
それでだいたい合ってますね。
でまあそういうわけなので、
基本的に「一方向的な移動」にはなりません。
「横方向」の他に、
「縦方向のズレ」も考える必要があります。
とまあそういうわけなので、
玉の様子は x,y 軸で考える必要があって、
\begin{array}{lll} &\mathrm{before} & \mathrm{after} \\ \\ \displaystyle x:&\displaystyle \frac{h}{λ} & \displaystyle =\frac{h}{λ^{\prime}}\cos θ+ m_ev \cos \phi \\ \\ y:&0&\displaystyle =\frac{h}{λ^{\prime}}\sin θ - m_ev \sin \phi \end{array}
それを『運動量保存則』で書くとこんな感じの式が。
他にも「エネルギー保存の法則」だと、
\begin{array}{rlc} \displaystyle \frac{hc}{λ}&\displaystyle =\frac{hc}{λ^{\prime}}+\frac{1}{2}m_ev^2 \end{array}
こういう式も導かれます。
はい。とまあ下準備はこんな感じで、
これから「意味のありそうな式」を導くわけですが、
\begin{array}{llc} \displaystyle \frac{h}{λ} & \displaystyle =\frac{h}{λ^{\prime}}\cos θ+ m_ev \cos \phi \\ \\ 0&\displaystyle =\frac{h}{λ^{\prime}}\sin θ - m_ev \sin \phi \\ \\ \\ \displaystyle \frac{hc}{λ}&\displaystyle =\frac{hc}{λ^{\prime}}+\frac{1}{2}m_ev^2 \end{array}
これを見てると、
なんとなく意味のある式が導けそうな
そんな気がするようなしないような感じがしませんか?
三角関数の消去
とまあそういう感じで
これからこの式を整理していくわけですが、
どういう「意味のある式」が導けるのか
この時点じゃよく分かりません。
なのでこの時点では、
なんとなくで整理をしていきます。
\begin{array}{lrl} \displaystyle x:&\displaystyle \frac{h}{λ} & \displaystyle =\frac{h}{λ^{\prime}}\cos θ+ m_ev \cos \phi \\ \\ y:&0&\displaystyle =\frac{h}{λ^{\prime}}\sin θ - m_ev \sin \phi \end{array}
\begin{array}{lrl} \displaystyle x:&\displaystyle \frac{h}{λ} - \frac{h}{λ^{\prime}}\cos θ & \displaystyle = m_ev \cos \phi \\ \\ y:&m_ev \sin \phi&\displaystyle =\frac{h}{λ^{\prime}}\sin θ\end{array}
というわけでとりあえずこのように
「角度 θ,\phi 」で整理してみてみると、
\begin{array}{llc} \displaystyle \sin^2 x+\cos^2 x&=1 \\ \\ (m_ev \sin \phi)^2+(m_ev \cos \phi)^2 &= m_e^2v^2\end{array}
式の形から、
「三角関数」を整理できそうなので、
\begin{array}{rlc} (m_ev \cos \phi)^2&= \displaystyle \left( \frac{h}{λ} - \frac{h}{λ^{\prime}}\cos θ \right)^2 \\ \\ (m_ev \sin \phi)^2&= \displaystyle \left( \frac{h}{λ^{\prime}}\sin θ \right)^2 \\ \\ \\ (m_ev)^2&\displaystyle =\left( \frac{h}{λ} - \frac{h}{λ^{\prime}}\cos θ \right)^2+\left( \frac{h}{λ^{\prime}}\sin θ \right)^2 \end{array}
こうやって「電子の角度 \phi 」を消してみます。
この時点では、
これに何の意味があるのかまだ分かりません。
ただ、少しだけすっきりした形にはなりました。
できるだけ変数を消したい
「変数を減らす」とちょっとすっきりするので、
できる限りその方向で式を変形してみます。
というわけでそれを考えていくわけですが、
なんか「エネルギー保存の法則」を見てみると、
「運動量 m_ev を消せそう」な気が。
\begin{array}{rlc} \displaystyle \frac{hc}{λ}&\displaystyle =\frac{hc}{λ^{\prime}}+\frac{1}{2}m_ev^2 \\ \\ \displaystyle \frac{hc}{λ} - \frac{hc}{λ^{\prime}}&=\displaystyle \frac{1}{2}m_e v^2 \end{array}
\begin{array}{rlc} \displaystyle \frac{1}{2}m_e v^2 &\displaystyle =\frac{hc}{λ} - \frac{hc}{λ^{\prime}} \\ \\ m_e^2v^2&\displaystyle =2m_e \left( \frac{hc}{λ} - \frac{hc}{λ^{\prime}} \right) \\ \\ \\ (m_ev)^2&\displaystyle =2m_e \left( \frac{hc}{λ} - \frac{hc}{λ^{\prime}} \right) \end{array}
というわけで試してみると、
なんか良い感じになって、
\begin{array}{rlc} \displaystyle (m_ev)^2&\displaystyle =\left( \frac{h}{λ} - \frac{h}{λ^{\prime}}\cos θ \right)^2+\left( \frac{h}{λ^{\prime}}\sin θ \right)^2 \\ \\ &\displaystyle =h^2\left( \frac{1}{λ} - \frac{1}{λ^{\prime}}\cos θ \right)^2+h^2\left( \frac{1}{λ^{\prime}}\sin θ \right)^2 \\ \\ \\ (m_ev)^2&\displaystyle =2m_e \left( \frac{hc}{λ} - \frac{hc}{λ^{\prime}} \right) \\ \\ &\displaystyle =2m_e hc \left( \frac{1}{λ} - \frac{1}{λ^{\prime}} \right)\end{array}
更にこれを整理していくと
\begin{array}{rlc} \displaystyle 2m_e hc \left( \frac{1}{λ} - \frac{1}{λ^{\prime}} \right)&\displaystyle =h^2\left( \frac{1}{λ} - \frac{1}{λ^{\prime}}\cos θ \right)^2+h^2\left( \frac{1}{λ^{\prime}}\sin θ \right)^2 \\ \\ \displaystyle \frac{2m_e c}{h} \left( \frac{1}{λ} - \frac{1}{λ^{\prime}} \right)&\displaystyle =\left( \frac{1}{λ} - \frac{1}{λ^{\prime}}\cos θ \right)^2+\left( \frac{1}{λ^{\prime}}\sin θ \right)^2 \end{array}
こういう形に整理できます。
式の整理
右のやつがちょっと整理できそうなので、
\sin^2x+\cos^2x=1 の形にしてみます。
\begin{array}{lll} \displaystyle \left( \frac{1}{λ} - \frac{1}{λ^{\prime}}\cos θ \right)^2 \\ \\ =\displaystyle \left( \frac{1}{λ} \right)^2-2 \left( \frac{1}{λ} \right) \left(\frac{1}{λ^{\prime}}\cos θ \right)+ \left(\frac{1}{λ^{\prime}}\cos θ \right)^2 \end{array}
\begin{array}{lll} \displaystyle \left( \frac{1}{λ} - \frac{1}{λ^{\prime}}\cos θ \right)^2+\left( \frac{1}{λ^{\prime}}\sin θ \right)^2 \\ \\ =\displaystyle \left( \frac{1}{λ} \right)^2-2 \left( \frac{1}{λ} \right) \left(\frac{1}{λ^{\prime}}\cos θ \right)+ \left(\frac{1}{λ^{\prime}}\cos θ \right)^2 +\left( \frac{1}{λ^{\prime}}\sin θ \right)^2 \\ \\ =\displaystyle \left( \frac{1}{λ} \right)^2-2 \left( \frac{1}{λ} \right) \left(\frac{1}{λ^{\prime}}\cos θ \right) +\left( \frac{1}{λ^{\prime}} \right)^2 \end{array}
するとこのように。
んで次、左のやつをこうして、
\begin{array}{lllc} \displaystyle \frac{2m_e c}{h} \left( \frac{1}{λ} - \frac{1}{λ^{\prime}} \right) & \displaystyle = \frac{2m_e c}{h} \left( \frac{λ^{\prime}-λ}{λλ^{\prime}} \right) \end{array}
右のやつをこれに寄せてみます。
\begin{array}{lll} \displaystyle \left( \frac{1}{λ} \right)^2-2 \left( \frac{1}{λ} \right) \left(\frac{1}{λ^{\prime}}\cos θ \right) +\left( \frac{1}{λ^{\prime}} \right)^2 \\ \\ \displaystyle = \left( \frac{1}{λ} \right)^2 +\left( \frac{1}{λ^{\prime}} \right)^2 - 2 \frac{1}{λλ^{\prime}}\cos θ \end{array}
すると「分母を合わせることができそう」なので、
\begin{array}{rlc} \displaystyle \left( \frac{1}{λ} \right)^2 +\left( \frac{1}{λ^{\prime}} \right)^2&\displaystyle =\left( \frac{1}{λ}-\frac{1}{λ^{\prime}} \right)^2+2\left( \frac{1}{λ} \right)\left( \frac{1}{λ^{\prime}} \right) \\ \\ &\displaystyle =\left( \frac{λ^{\prime}-λ}{λλ^{\prime}} \right)^2+2\frac{1}{λλ^{\prime}} \end{array}
このようにしてみると良い感じに。
\begin{array}{rlc} \displaystyle 2m_e hc \left( \frac{1}{λ} - \frac{1}{λ^{\prime}} \right)&\displaystyle =h^2\left( \frac{1}{λ} - \frac{1}{λ^{\prime}}\cos θ \right)^2+h^2\left( \frac{1}{λ^{\prime}}\sin θ \right)^2 \\ \\ \displaystyle \frac{2m_e c}{h} \left( \frac{λ^{\prime}-λ}{λλ^{\prime}} \right) &\displaystyle =\left( \frac{λ^{\prime}-λ}{λλ^{\prime}} \right)^2+2\frac{1}{λλ^{\prime}} - 2 \frac{1}{λλ^{\prime}}\cos θ \\ \\ &\displaystyle =\left( \frac{λ^{\prime}-λ}{λλ^{\prime}} \right)^2+2 \frac{1}{λλ^{\prime}}(1-\cos θ) \end{array}
で「分母」を消すと↓になって、
\begin{array}{rlc} \displaystyle \frac{2m_e c}{h} \left( \frac{λ^{\prime}-λ}{λλ^{\prime}} \right)& \displaystyle =\left( \frac{λ^{\prime}-λ}{λλ^{\prime}} \right)^2+2 \frac{1}{λλ^{\prime}}(1-\cos θ) \\ \\ \\ \displaystyle \frac{2m_e c}{h} \left( λ^{\prime}-λ \right)& \displaystyle =\frac{(λ^{\prime}-λ)^2}{λλ^{\prime}}+2(1-\cos θ) \end{array}
「 (λ^{\prime}-λ)^2 」が邪魔な部分として残ります。
小さすぎる部分を 0 に近似
「波長の差 λ^{\prime}-λ の2乗」を、
『小さすぎるので無視しても良い』とすると、
\begin{array}{llc} (λ^{\prime}-λ)&≒10^{-12} \\ \\ \\ \displaystyle (λ^{\prime}-λ)^2&≒10^{-24} \\ \\ \\ 10^{-24}&<<10^{-12} \\ \\ \\ \displaystyle \frac{(λ^{\prime}-λ)^2}{λλ^{\prime}}&≒0 \end{array}
このように近似することができるので、
後は「波長の差 λ^{\prime}-λ 」で整理すれば、
\begin{array}{rlc} \displaystyle \frac{2m_e c}{h} \left( λ^{\prime}-λ \right)& \displaystyle =\frac{(λ^{\prime}-λ)^2}{λλ^{\prime}}+2(1-\cos θ) \\ \\ & \displaystyle =0+2(1-\cos θ) \\ \\ \\ \displaystyle \frac{m_e c}{h} \left( λ^{\prime}-λ \right)& \displaystyle =(1-\cos θ) \\ \\ \displaystyle λ^{\prime}-λ& \displaystyle =\frac{h}{m_e c}(1-\cos θ) \end{array}
こうなりますよ、と。
\begin{array}{rlc} \displaystyle Δλ&=λ^{\prime}-λ \\ \\ &\displaystyle =\frac{h}{m_e c}(1-\cos θ) \end{array}
まあこういう感じで
「コンプトン効果」の式は導けます。
最後、
θ=90° の場合の波長の差なんですが、
\begin{array}{rlc} \displaystyle Δλ&=λ^{\prime}-λ \\ \\ &\displaystyle =\frac{h}{m_e c}(1-\cos θ) \\ \\ \\ &\displaystyle =\frac{h}{m_e c}(1-0) \\ \\ &≒2.4×10^{-12}(m) \end{array}
これは「コンプトン波長」と呼ばれています。
ある種の目安ですね。
頭の片隅に留めておくくらいでOKです。
見るということ
「測定」の中でも、特に『見る』ことは、
『存在の証明』と密接に結びついています。
「目」にしても「顕微鏡」にしても、
基本的にはこれを実現するためにあるわけで、
だからこそ、
あらゆるものを『視覚化する技術』は発達し、
それによって「存在」は確認されてきました。
で、この『見る』って行為なんですけど、
思えば、これは具体的にはなにをしてるんでしょう?
考えてみると、
例えば「反射した光」を「目」で受け取っている。
あるいはより抽象的には、
『レンズなどで拡大された電磁波』を、
『目で見える形』で受け取っている。
という感じに説明されると思われますが、
さて、実際はどうなんでしょうか。
まあ結論としてはそんな感じなわけですが。
ともかく、要は「反射した波」と
「それを受け取るもの」さえあれば、
この『見る』という行為は実現できる。
そういう風に言えることは納得できると思います。
具体的には、例えば
「目」で『可視光線』を
「光学顕微鏡」で『肉眼より広い範囲』を
「電子顕微鏡」で『原子くらいの大きさ』を
\begin{array}{lllll} 10^{-4}\mathrm{m}&:\displaystyle \mathrm{Eye} \\ \\ 10^{-6}\mathrm{m} &:\mathrm{Optical \,\, Microscope} \\ \\ 10^{-12}\mathrm{m} &:\mathrm{Electronic \,\, Microscope} \\ \\ 10^{-19}\mathrm{m} &:\mathrm{Particle \,\, Accelerator} \end{array}
それぞれ「反射したもの」を
「目の役割を持つもので拾う」ことで、
『見える形』にする、という感じで、
この世界のあらゆるものは、
「位置・運動量など」で『図を描く』ことで、
『見える形』に変換されています。
それこそ『反射された波を増幅』して、
それを「スクリーン」や「蛍光板」で捉える
という具合に。
まとめると、
『何か』を「見る・観測する」ということは、
『反射したものを捉える』ことを指します。
まあつまり『波を反射させること』
あるいは『波をぶつけること』こそが、
『見る』という行為には必要不可欠なわけで、
であるなら、
『見る』ことによって「乱れ」は必ず発生するので、
『ミクロの世界では』それを考える必要があります。
位置の変化と運動量の変化
「測定」のためには
『波を反射させる必要がある』ことが分かったので、
\begin{array}{rlc} \displaystyle Δx&≒Δλ \\ \\ Δp&\displaystyle ≒\frac{h}{Δλ} \end{array}
「コンプトン効果」の感じから、
このような『ズレがある』ことが予想できます。
\begin{array}{rlc} ΔxΔp&≒h \\ \\ \displaystyle Δx Δp &\displaystyle ≥\frac{ℏ}{2} \end{array}
なのでまあこんな感じになって、
なんかよく分からん形になるわけですが、
\begin{array}{rlc} \displaystyle Δx Δp &\displaystyle ≥\frac{ℏ}{2} \end{array}
実はこのよく分からん式が
「ハイゼンベルグの不確定性原理」
って呼ばれてるやつなんですよ。
確か80年くらいだったと思うんですが、
その間、これはずっと正しいと信じられてきました。
その程度には、
これは「そこそこ正しい式」です。
ただまあ現代では
「正確ではない」
ということが『実証』されていて、
\begin{array}{rlc} \displaystyle ε_x η_p+η_p σ_x+σ_p ε_x&\displaystyle ≥\frac{ℏ}{2} \end{array}
「小澤の不等式」のような、
より厳密な式が求められています。
とはいっても、
「ハイゼンベルグの不確定性原理」は
『不要になった式』というわけではありません。
というのも、
「発想の元になった」という点で、
この式は非常に有用なんです。
これに加えて、
これは「確実に正しい式」ではありませんが、
『だいたい正しい式』ではあります。
なのでまあ、
これは『矛盾した結果も導く式』ではあるんですが、
「大雑把な目安になる式」ではあるんですよ。
ですから、覚える意味の無い式だ
と言えるほどおかしな式ではありません。
ケナードの不等式
これは『物理量の標準偏差』についての式です。
具体的には↓みたいな式ですね。
\begin{array}{rlc} \displaystyle σ(Q)σ(P)&\displaystyle ≥\frac{ℏ}{2} \end{array}
見て何となくわかると思いますが、
これは「不確定性関係」の
『数学的根拠にされた式』になります。
記号の意味を整理しておくと、
\begin{array}{rlc} \displaystyle σ^2(X)&\displaystyle =\frac{1}{n}\sum_{i=1}^{n} (X_i-\overline{X})^2 \\ \\ [X,Y]&=XY-YX \end{array}
まあこんな感じですね。
\overline{X} は「物理量 X の平均」で、
σ^2(X) は「分散」を表しています。
まあこの時点じゃよく分からなくて当然です。
なのでとりあえず覚えておきましょう。
一応、ざっと説明しておくと、
これ、元は「ロバートソンの不等式」と言われるもので、
\begin{array}{rlc} \displaystyle σ(A)σ(B)&\displaystyle ≥\frac{1}{2}|\langle [A,B] \rangle | \end{array}
これの「物理量 A,B 」が
『位置 Q 』と『運動量 P 』の場合、
\begin{array}{rlc} \displaystyle [Q,P]&=iℏ \end{array}
つまり「正準交換関係」の場合に
\begin{array}{rlc} \displaystyle σ(Q)σ(P)&\displaystyle ≥\frac{1}{2}ℏ \end{array}
こうなる
という式なので、
現状では分かるはずがありません。
証明もすごく面倒なので、
これの説明は後回しにします。
擾乱
これは「測定による物理量の乱れ」
つまり『測定による乱れ』を表す単語なんですけど、
すごく耳慣れない言葉だと思います。
単に「測定による乱れ」と
そのままそう言っても良いんですけど、
これだとちょっと分かり難いですよね?
というのも「測定」での
「測定誤差」と「測定による乱れ」では、
すごく意味が似通っています。区別し辛いです。
なので「はっきり別と分かる単語」が欲しくて、
結果、これが採用されました。
再度確認しておくと、
『測定誤差の分かる物理量』と
『その測定によって乱れる』「他の物理量」があって、
その「乱れ」を「擾乱」と言います。
具体的には「位置」の測定を行った時の、
『運動量の乱れ』が「擾乱」です。
記号では↓のように表されることが多いですね。
\begin{array}{lll} \displaystyle η_p& η(P) \\ \\ &η(P) &\displaystyle = \sqrt{ \overline{Δp^2} } \\ \\ &Δp&=|p_{\mathrm{real}}-p_{\mathrm{measure}}|\end{array}
Δp は「偏差」を
η_p は「偏差の標準偏差」を表しています。
詳細は後で説明するので、
今はぼんやり覚えておきましょう。
測定誤差
これは「測定の誤差」を表していて、
「擾乱」とはまた別の単語です。
\begin{array}{lll} \displaystyle ε_q &ε(Q)\\ \\ &ε(Q)&\displaystyle = \sqrt{ \overline{Δq^2 } } \\ \\ &Δq&=|q_{\mathrm{real}}-q_{\mathrm{measure}}| \end{array}
式だとほぼ同じ感じですが、
「測定されている方」は『片方』なので、
きちんと区別して覚えましょう。
これもぼんやりしていてあれですが、
現状では適当に覚えておけば十分です。
詳しくは↓で解説。
ハイゼンベルグの不確定性原理の破れ
「ケナードの式」を元に、
昔、ハイゼンベルグさんは
「不確定性の式」を↓のように書きました。
\begin{array}{rlc} \displaystyle ΔxΔp&≒h \\ \\ σ(X)σ(P)&\displaystyle ≥\frac{1}{2}ℏ \\ \\ \\ ΔxΔp&\displaystyle ≥\frac{1}{2}ℏ\end{array}
これを「不確定性原理」と呼んでいたわけですが、
なんか、違和感ありますよね。
結論を先に言っておくと、
これ、正確な書き換えではありません。
まあつまり正確な不等式ではないから、
『ある程度の範囲』であれば正しくなるんですけど、
「より精密な実験」を行った時、
言い換えると、
「 ℏ/2 より小さくなる」ように
「高精度で実験を行った」場合、
『この式で示された誤差』よりも、
「より小さな誤差」で測定できたりします。
まあつまり『測定の誤差』は、
「この式より小さくとれる」んです。
詳細は省きますが、
「中性子光学実験装置」での「スピン測定実験」とか
この辺りを調べると、
『ハイゼンベルグの不確定性原理』が
正しくならない結果を示すことが分かるかと。
不確定性原理の訂正
|| ケナードの不等式との混同
「ハイゼンベルグの不確定性原理」は、
数学的にはわりと適当に定められています。
\begin{array}{rlc} \displaystyle ΔxΔp&≒h &&〇 \\ \\ \displaystyle ΔxΔp&\displaystyle ≥\frac{ℏ}{2} &&\mathrm{?} \end{array}
しかし、これは「ある程度正しい式」です。
『完全に間違っているわけではありません』
そう、「正しくない」わけではなく、
「ある一定の領域までは正しい」んですよ。これ。
↑で言ったように、
『精密な計測』だとこの不等式は成立しませんが、
それでも「ある程度は正しい」上に、
『最小値がある』ことは確かなんです。
まあつまり「もっと小さな限界」があって、
\begin{array}{llc} \displaystyle ΔxΔp&\displaystyle ≥\frac{ℏ}{2}-α \\ \\ ΔxΔp+α&\displaystyle ≥\frac{ℏ}{2} \end{array}
それはこのように書けるはずなんですよ。
はい。まあですからこの式は元より、
『訂正できる可能性がある』わけで、
実際、訂正されちゃったわけです。
ロバートソンの不等式
|| 不確定性原理の式にかなり似てる式
これは「不確定性原理の根拠っぽい式」です。
\begin{array}{rlc} \displaystyle σ(A)σ(B)&\displaystyle ≥\frac{1}{2}|\langle [A,B] \rangle | \end{array}
数式的にはこんな感じ。
「標準偏差」と「交換子」の不等式になります。
これは主に「偏差」と「分散」に加えて、
「交換子」と「二次方程式の形」から導けるもので、
\begin{array}{lll} \displaystyle ΔA&=A-\langle A \rangle \\ \\ ΔB&=B-\langle B \rangle \\ \\ σ^2(A)&=\langle ΔA^2\rangle \\ \\ \\ [A,B]&=AB-BA \\ \\ (A+αB)(A-αB)&=A^2-α(AB-BA)-α^2B^2 \end{array}
この材料を使って思考錯誤していけば、
まあこういう式もあるか、って感じで導けます。
式変形で使う公式の確認
以下、式変形でちょっと変な計算を使うので、
その確認をしておきます。
\begin{array}{lll} [ΔA,ΔB]&=[A,B] \\ \\ (i[A,B])^{\dagger}&=i[A,B] \\ \\ \langle i[A,B] \rangle &=\mathrm{Real \,\, Number} \end{array}
「 A,B はエルミート演算子」とします。
A,B の中身はだいたい観測可能量なので。
なにより、
「実数」が絡む『意味のある行列』の中でも、
特に範囲が広いのがこの「エルミート行列」です。
ですから、この縛りを設けたとしても
かなり広い範囲をカバーできるので、
狭い範囲じゃないと扱えない
ってことにはまずなりません。
はい。とまあそういう感じなので、
とりあえず一つずつ確認していきましょうか。
\begin{array}{lll} \displaystyle [ΔA,ΔB] &=[ A-\langle A \rangle ,B-\langle B\rangle ] \\ \\ &=ΔAΔB-ΔBΔA \\ \\ \\ ΔAΔB&=AB\textcolor{pink}{-A\langle B\rangle}\textcolor{skyblue}{- \langle A \rangle B} \textcolor{yellow}{+\langle A \rangle \langle B\rangle} \\ \\ ΔBΔA&=BA\textcolor{skyblue}{-B\langle A \rangle} \textcolor{pink}{-\langle B\rangle A}\textcolor{yellow}{+\langle B\rangle\langle A\rangle} \\ \\ \\ ΔAΔB-ΔBΔA&=AB-BA \\ \\ &=[A,B] \end{array}
まずこれはこう。
\begin{array}{rlc} \displaystyle A&=A^{\dagger} \\ \\ (AB)^{\dagger}&=B^{\dagger}A^{\dagger} \end{array}
\begin{array}{llllll} \displaystyle (AB)^{\dagger}&=B^{\dagger}A^{\dagger} \end{array} はちょっと複雑ですが
\begin{array}{llllll} \displaystyle A&=& \begin{pmatrix} a_{11}&a_{12}&\cdots&a_{1m} \\ \\ a_{21}&a_{22}&\cdots&a_{2m} \\ \\ \vdots&\vdots&&\vdots \\ \\ a_{n1}&a_{n2}&\cdots&a_{nm} \end{pmatrix} \\ \\ B&=& \begin{pmatrix} b_{11}&b_{12}&\cdots&b_{1n} \\ \\ b_{21}&b_{22}&\cdots&b_{2n} \\ \\ \vdots&\vdots&&\vdots \\ \\ b_{m1}&b_{m2}&\cdots&b_{mn} \end{pmatrix} \end{array}
\begin{array}{llllll} \displaystyle A^{\mathrm{tr}}&=&\begin{pmatrix} \displaystyle a^{\mathrm{tr}}_{11} &a^{\mathrm{tr}}_{12} &\cdots&a^{\mathrm{tr}}_{1n} \\ \\ a^{\mathrm{tr}}_{21} &a^{\mathrm{tr}}_{22} &\cdots&a^{\mathrm{tr}}_{2n} \\ \\ \vdots&\vdots&&\vdots \\ \\ a^{\mathrm{tr}}_{m1} &a^{\mathrm{tr}}_{m2} &\cdots&a^{\mathrm{tr}}_{mn} \end{pmatrix}&=&\begin{pmatrix} a_{11}&a_{21}&\cdots&a_{n1} \\ \\ a_{12}&a_{22}&\cdots&a_{n2} \\ \\ \vdots&\vdots&&\vdots \\ \\ a_{1m}&a_{2m}&\cdots&a_{nm} \end{pmatrix} \\ \\ \\ B^{\mathrm{tr}}&=&\begin{pmatrix} \displaystyle b^{\mathrm{tr}}_{11} &b^{\mathrm{tr}}_{12} &\cdots&b^{\mathrm{tr}}_{1m} \\ \\ b^{\mathrm{tr}}_{21} &b^{\mathrm{tr}}_{22} &\cdots&b^{\mathrm{tr}}_{2m} \\ \\ \vdots&\vdots&&\vdots \\ \\ b^{\mathrm{tr}}_{n1} &b^{\mathrm{tr}}_{n2} &\cdots&b^{\mathrm{tr}}_{nm} \end{pmatrix} &=& \begin{pmatrix} b_{11}&b_{21}&\cdots&b_{m1} \\ \\ b_{12}&b_{22}&\cdots&b_{m2} \\ \\ \vdots &\vdots&&\vdots \\ \\ b_{1n}&b_{2n} &\cdots&b_{mn} \end{pmatrix} \end{array}
\begin{array}{llllll}AB&=&\begin{pmatrix} \displaystyle\sum_{i=1}^{m}{a_{1i}b_{i1}} & \displaystyle\sum_{i=1}^{m}\textcolor{pink}{a_{1i}b_{i2}}&\cdots& \displaystyle\sum_{i=1}^{m}\textcolor{pink}{a_{1i}b_{in}} \\ \\ \displaystyle\sum_{i=1}^{m}\textcolor{skyblue}{a_{2i}b_{i1}}&\displaystyle\sum_{i=1}^{m}a_{2i}b_{i2}&\cdots&\displaystyle\sum_{i=1}^{m}\textcolor{pink}{a_{2i}b_{in}} \\ \\ \vdots &\vdots& & \vdots \\ \\ \displaystyle\sum_{i=1}^{m}\textcolor{skyblue}{a_{ni}b_{i1}}& \displaystyle\sum_{i=1}^{m}\textcolor{skyblue}{a_{ni}b_{i2}} &\cdots& \displaystyle\sum_{i=1}^{m}{a_{ni}b_{in}} \end{pmatrix} \\ \\ B^{\mathrm{tr}}A^{\mathrm{tr}}&=&\begin{pmatrix} \displaystyle\sum_{i=1}^{m}b_{i1}a_{1i} & \displaystyle\sum_{i=1}^{m}\textcolor{skyblue}{b_{i1}a_{2i}}&\cdots& \displaystyle\sum_{i=1}^{m}\textcolor{skyblue}{b_{i1}a_{ni}} \\ \\ \displaystyle\sum_{i=1}^{m}\textcolor{pink}{b_{i2}a_{1i}}&\displaystyle\sum_{i=1}^{m}{b_{i2}a_{2i}}&\cdots&\displaystyle\sum_{i=1}^{m}\textcolor{skyblue}{b_{i2}a_{ni}} \\ \\\vdots &\vdots&& \vdots \\ \\ \displaystyle\sum_{i=1}^{m}\textcolor{pink}{b_{in}a_{1i}}&\displaystyle\sum_{i=1}^{m}\textcolor{pink}{b_{in}a_{2i}}&\cdots& \displaystyle\sum_{i=1}^{m}b_{in}a_{ni} \end{pmatrix} \end{array}
これが分かれば後は簡単。
\begin{array}{lll} \displaystyle (i[A,B])^{\dagger} &=\Bigl( i(AB-BA) \Bigr)^{\dagger} \\ \\ &=-i(AB-BA)^{\dagger} \\ \\ \\ &=-i\Bigl((AB)^{\dagger}-(BA)^{\dagger} \Bigr) \\ \\ &=-i\Bigl(B^{\dagger}A^{\dagger}-A^{\dagger}B^{\dagger} \Bigr) \\ \\ &=i\Bigl(-B^{\dagger}A^{\dagger}+A^{\dagger}B^{\dagger} \Bigr) \\ \\ \\ &=i(-BA+AB) \\ \\ &=i[A,B] \end{array}
これはこうです。
確認しておくと、これが成り立つので、
i[A,B] はエルミート演算子と言えます。
\begin{array}{rlc} (i[A,B])^{\dagger}&=i[A,B] \\ \\ i[A,B]|\psi\rangle &=r|\psi\rangle \end{array}
\begin{array}{lll} \displaystyle\langle i[A,B] \rangle &=\langle \psi| i[A,B] |\psi \rangle \\ \\ &=\langle \psi| r |\psi \rangle \\ \\ &=\mathrm{Real \,\, Number} \end{array}
で3つ目は
「 i[A,B] がエルミート演算子」であることから、
「固有値は実数になる」ので結果的にこうなります。
不等式のアプローチ
「実数の2乗は正になる」とか
「絶対値は 0 以上になる」とか
\begin{array}{llc} α^2&≥0 \\ \\ \displaystyle |z|&≥0 \\ \\ |z|^2&≥0 \end{array}
こういうのを使うと、
「大小比較できる形」の中でも、
特に『下から抑える形にする』ことができます。
んでまあこれでなんとなく分かると思いますが、
この形が「不等式を作る」やり方の基本で、
「不等式を作りたい」と思った時、
ほとんどの場合でこの形を経由することになります。
これは「複素数」の場合も同様で、
\begin{array}{rlc} \displaystyle z&=a+bi \\ \\ z^*z&=a^2+b^2 \\ \\ |z|&=\sqrt{z^*z} \end{array}
その場合は「大小比較できる形にする」ために、
↑の操作がよく使われますね。
\begin{array}{lllll} \displaystyle |A|&=\det(A) \\ \\ \langle A \rangle &=\langle \psi| A |\psi \rangle \end{array}
「ベクトル」やら「行列」やらの場合も同様です。
これもこのままでは『大小比較できない』ので、
このようにスカラー値に変更する操作が使われます。
はい。とまあそんな感じで、
基本的に不等式はこのような形で書かれていて、
だからこそ↑のような操作がよく使われます。
最後、補足しておくと、
今回の式で使われているのは
「実数の二次方程式の判別式」です。
\begin{array}{rlc} \displaystyle ax^2+bx+c&=0 \\ \\ x&\displaystyle =\frac{-b±\sqrt{b^2-4ac}}{2a} \end{array}
\begin{array}{rlc} \displaystyle b^2-4ac&≤0 \end{array}
式としてはこんな感じ。
見覚えのある形だと思います。
意味のありそうな不等式
「不等式」というのは
『値の範囲を抑える』ために存在しています。
\begin{array}{rll} \displaystyle α&≥0 \\ \\ |α|&≤1 \\ \\ |α|&<\infty \end{array}
「関数の比較」「図形の形」
「確率」「収束」「連続性」などなど、
そういう「関数の意味」を調べる場合、
不等式は指標として必要になるんですよ。
というのも、
例えば↓の性質を満たす場合、
\begin{array}{rlc} \displaystyle 0&≤p&≤1 \end{array}
これは『確率としての意味を持つ』かもしれません。
他にも例えば、
\begin{array}{rlc} \displaystyle -1&≤x&≤1 \\ \\ -1&≤y&≤1 \end{array}
\begin{array}{rlc} \displaystyle x^2+y^2&≤1 \end{array}
↑はそれぞれ「正方形」「円」を表してます。
とまあそんな感じで、
「不等式」は意味の指標になるんですよ。
正準交換関係にある物理量
スカラー値で考える場合、
「交換関係」は基本的に 0 になります。
\begin{array}{rllll} \displaystyle αβ&=βα \\ \\ \\ [α,β]&=αβ-βα \\ \\ &=0 \end{array}
「交換法則」が成立する以上、
これは絶対です。
しかしこれは
あくまで「スカラー値」に限った話。
『物理量演算子』などの
「ベクトル」「行列」を考えると、
「交換」はほとんどの場合で出来ません。
そう、「交換法則」が成立しない範囲では、
0 になることはまず無いんですよ。
\begin{array}{lllll} &B=A \\ \\ ∨&B=E\\ &&→&\displaystyle AB=BA \\ ∨&B=A^{-1} \\ \\ ∨& B=O \end{array}
0 になるのは特別な場合だけ。
加えて「実数になる」のも特別なパターンで、
\begin{array}{rllll} \displaystyle \hat{q}&=q \\ \\ \hat{p}&\displaystyle =-iℏ\frac{\partial}{\partial q} \\ \\ \\ [\hat{q},\hat{p}]&=iℏ \end{array}
特に、↑の「正準交換関係」のようなものは
たまたま良い感じの値が得られた結果に過ぎません。
繰り返し言っておくと、
「正準交換関係」はかなり特殊なパターンです。
で、そういう特殊なパターンが存在する以上、
このような「交換子」を使ってみると、
\begin{array}{rlc} \displaystyle [\hat{q},\hat{p}]&=iℏ \\ \\ α&≥0 \\ \\ α&≥|iℏ| \end{array}
「スカラー値では無意味な不等式」でも
「ベクトル・行列では意味のある不等式」
というのが導けるのではないか
という予想ができます。
正準交換関係を定数に持つ不等式
「正準交換関係」のようなものを考えるために、
「交換子を含む不等式」を考えたい
そう考えた時、不等式の中には
「交換子」が入っていて欲しくなります。
\begin{array}{llc} \displaystyle [A,B]&=AB-BA \\ \\ [A+α,B+β]&=AB-BA+γ \end{array}
加えて「交換子が 0 にならない範囲」を考えたいので、
A,B は「行列」だと考えたいです。
\begin{array}{rlc} \displaystyle |A|&=\mathrm{det}(A) \\ \\ \langle A \rangle &=\langle\psi| A |\psi\rangle \end{array}
んで「行列」ですから、
「大小の比較を行えるようにする」ためにも
こういう「スカラー値」にする操作を考える必要が。
また「複素数」のパターンも考えたいので、
\begin{array}{rlc} \displaystyle |\langle A \rangle| &=|\langle\psi| A |\psi\rangle | \\ \\ \displaystyle \langle |A| \rangle &=\langle\psi| \,|A|\, |\psi\rangle \end{array}
このような形も考慮して、
「大小比較が可能な形にできる」
ということを確認しておきます。
統計と物理量
↑の時点じゃまだなにをすればって感じです。
しかし、例えば「統計」のような
考える『指標』が与えられたらどうでしょうか。
\begin{array}{lllll} \displaystyle [A,B]&=AB-BA \\ \\ [A+α,B+β]&=AB-BA+γ \\ \\ \\ \displaystyle [ΔA,ΔB]&=ΔAΔB-ΔBΔA \\ \\ \\ ΔAΔB&=(A-\langle A \rangle)(B-\langle B \rangle) \\ \\ ΔBΔA&=(B-\langle B \rangle)(A-\langle A \rangle) \end{array}
↑で確認しましたが、
\begin{array}{rlc} \displaystyle [ΔA,ΔB]&=[A,B] \end{array}
こうです。
なので『不等式の意味』を考える場合、
この「偏差」は『式を単純にする』のに使えます。
\begin{array}{rlc} \displaystyle σ^2(A)&=\langle ΔA^2 \rangle \end{array}
現時点ではあまり意味はありませんが、
後でこういう形を見ることがあるので
しっかり念頭に置いておきましょう。
交換子と二次方程式
「二次方程式の形」と
「交換子」を比較すると、
\begin{array}{llll} \displaystyle (αx-β)(αx+β)&=α^2x^2+(αβ-βα)x-β^2 \\ \\ [A,B]&=AB-BA \end{array}
↑のような形になるので、
「交換子の不等式」を考える時、
この形は使えそうだ、ということが予想できます。
というのも、
「交換子が出る部分」の代表的な状況は、
\begin{array}{rlc} \displaystyle (αx-β)(αx+β)&=α^2x^2+(αβ-βα)x-β^2 \\ \\ z^*z&=(a+bi)(a-bi) \end{array}
この「係数の計算」です。
なので「交換子」を考える場合、
最初に思い浮かぶのはこの形になります。
係数と判別式
「二次方程式の形」では、
「交換子」は「係数」に含まれています。
そして「二次方程式」には
「判別式」という『係数のみを使う』
「不等式を作る材料」があります。
つまり「交換子の不等式」を考える時、
↓のような「判別式」を考えると、
\begin{array}{rlc} \displaystyle [A,B]&=AB-BA \\ \\ (A+αB)(A-αB)&=A^2-α(AB-BA)-α^2B^2 \end{array}
\begin{array}{rlc} \displaystyle ax^2+bx+c&=0 \\ \\ \\ a&=-B^2 \\ \\ b&=-[A,B] \\ \\ c&=A^2 \end{array}
\begin{array}{rlc} \displaystyle b^2-4ac \end{array}
「交換子を含む不等式」が得られます。
判別式と不等式
「交換子」と「二次方程式」の比較から、
↓のような形が使えそうですが、
\begin{array}{rlc} \displaystyle [A,B]&=AB-BA \\ \\ (A+xB)(A-xB)&=A^2-(AB-BA)x-x^2B^2 \end{array}
二次式の右側は確定していません。
\begin{array}{rlc} \displaystyle (A+xB)(A-xB) &=\mathrm{?} \end{array}
まあつまりこのままでは、
「係数」に虚数が来る可能性があるんですよ。
しかし仮に虚数が係数にくると
「判別式が使えない」などの
あらゆる性質を無くしてしまいます。
そうなると更にいろいろ見直す必要があるので、
できれば「実数の係数だけ」にしておきたいです。
なので、右には実数しか来ないよう
どうにかする必要があります。
要望をまとめると、
まず前提として、
(αx+β)(αx-β) の形はそのままが良いです。
判別式と交換子を結ぶ形なので、
この形は崩せません。
その上で
「係数」を「実数だけにしたい」ので、
\begin{array}{rlc} \displaystyle \Bigl| ax^2+bx+c \Bigr| &=\sqrt{z^*z} \end{array}
例えば |X|^2≥0 のような
『実数に変換する操作』を考える必要があります。
とまあそういう感じでいろいろ考えてみると、
\begin{array}{lll} | z |&=\sqrt{z^*z} \\ \\ | z |^2&=z^*z \\ \\ \\ | A-ixB |^2&=(A-ixB)^{\dagger}(A-ixB) \end{array}
このように「 x を実数」として
「複素共役」を採用した後、
\begin{array}{rlc} \displaystyle \langle | A-ixB |^2 \rangle&≥0 \end{array}
「行列」をスカラー値に変換するために
「内積」を使って形を整えれば、
\begin{array}{rlc} \displaystyle | A-ixB |^2 &\displaystyle = \left( \sqrt{\displaystyle (A-ixB)^{\dagger}(A-ixB)} \right)^2 \\ \\ &\displaystyle = (A-ixB)^{\dagger}(A-ixB) \\ \\ \\ &\displaystyle = (A^{\dagger}+ixB^{\dagger})(A-ixB) \\ \\ &\displaystyle = (A+ixB)(A-ixB) \\ \\ \\ &=A^2-i(AB-BA)x+B^2x^2 \end{array}
\begin{array}{rlc} \displaystyle \langle | A-ixB |^2 \rangle&\displaystyle =\left\langle \left( \sqrt{\displaystyle (A-ixB)^{\dagger}(A-ixB)} \right)^2 \right\rangle \\ \\ &\displaystyle =\left\langle A^2-i(AB-BA)x+B^2x^2 \right\rangle \\ \\ \\ &=\left\langle A^2 \right\rangle+\left\langle -i(AB-BA)x \right\rangle+\left\langle B^2x^2 \right\rangle \\ \\ &=\left\langle A^2 \right\rangle+\left\langle -i(AB-BA) \right\rangle x+\left\langle B^2 \right\rangle x^2 \end{array}
実現したい要望を全て満たすことができます。
ここまで来れば後は簡単ですね。
↑で定めたように「 x は実数」ですから、
「 y≥0 なので重解以外は存在せず」
\begin{array}{llll} \displaystyle b^2-4ac≥0 &→& (x-α)(x-β)=0 \\ \\ b^2-4ac=0&→&(x-α)^2=0 \\ \\ b^2-4ac≤0&→&(x-α)^2≥0 \end{array}
「判別式」は↓に定まります。
\begin{array}{llc} \displaystyle b^2-4ac&≤0 \\ \\ (\langle -i(AB-BA) \rangle)^2-4\langle A^2 \rangle \langle B^2 \rangle&≤0 \end{array}
とまあこのような感じで考えていくと、
「判別式で不等式を得るアプローチ」として
このようなやり方が導けるわけです。
いくらか発想に行き着くまでが大変ですが、
不等式と言えば「2乗」ですから、
あらゆる発想はその辺りを経由します。
そこから総当たりで思考錯誤してみれば、
どうあれ、この発想にはいずれ行き着けるでしょう。
形式の整理
ちゃんと「行列」「複素数」が、
「大小比較できる形になってるか」
\begin{array}{llc} \displaystyle \langle | A-ixB |^2 \rangle \\ \\ \left\langle A^2 \right\rangle+\left\langle -i(AB-BA) \right\rangle x+\left\langle B^2 \right\rangle x^2 \end{array}
なぜこの形になるのか
ざっと確認しておきます。
まず行列 A,B をスカラーにする方法ですけど、
\begin{array}{rlc} \displaystyle \langle A \rangle &=\langle\psi|A|\psi\rangle \\ \\ |A|&=\mathrm{det}(A) \end{array}
トレースなどもありますが、
考えられるのは主にこの2つ。
この時点ではどっちを採用するか分かりませんが、
「固有値」「二次方程式の形」を考えると
「平均・期待値」の方を採用したくなる
というのはなんとなく分かると思います。
「複素数」の「実数への変換」については
\begin{array}{rlc} \displaystyle | z |&=\sqrt{z^{\dagger}z} \end{array}
基本的にはこれだけなので、
特に迷う必要はありません。
そして最後
「二次方程式のアプローチ」ですが、
これは↑のものを↓のように組み合わせて
\begin{array}{lll} \displaystyle (α+xβ)(α-xβ) \\ \\ \\ | A-ixB |&\displaystyle =\sqrt{ \displaystyle (A-ixB)^{\dagger}(A-ixB) } \\ \\ \langle A-ixB \rangle&=\langle A \rangle+\langle -ixB \rangle \\ \\ \\ \langle A-ixB \rangle^2& \\ \\ |A-ixB|^2& \\ \\ \\ |\langle A-ixB \rangle^2|&≥0 \\ \\ \langle |A-ixB|^2 \rangle &≥0 \end{array}
順番に加工していけば、
『大小を比較可能な形にできます』
まとめると、
(A+ixB)(A-ixB) は、
そもそも↓のような形にしないと、
\begin{array}{rlc} |\langle A-ixB \rangle^2|&≥0 \\ \\ \langle |A-ixB|^2 \rangle &≥0 \end{array}
『比較可能な形』にはできないんですね。
まあですから、結果的にこうなるわけです。
交換子と不等式と統計
ちょっと長くなったので、
↑で話した流れをざっとおさらいしておきます。
まず『目的』は
「正準交換関係」のようなものがあることから、
「交換子の不等式を求めてみたい」という感じで、
\begin{array}{rlc} \displaystyle [A,B] \end{array}
そのために「不等式のアプローチ」を考えよう
というのがスタート地点です。
その過程で、
「行列」「複素数」を考慮する必要があって、
\begin{array}{rlc} \displaystyle |\langle [A,B] \rangle| &≥α \end{array}
そのためにこのような加工を考えます。
「不等式のアプローチ」については、
「交換子」と「二次方程式の形」から、
「判別式が使えそう」なので
\begin{array}{llc} \displaystyle [A,B] &=AB-BA \\ \\ (α+xβ)(α-xβ)&=α^2-(αβ-βα)x-β^2x^2 \\ \\ \\ | A-ixB |^2 &=(A-ixB)^{\dagger}(A-ixB) \end{array}
このような形を考えます。
\begin{array}{rlc} \displaystyle \langle | A-ixB |^2 \rangle&≥0 \end{array}
また、着地で「分散を考えたい」ので、
式の形はこれを採用することに。
で、ここから実際に
「判別式」を使って整理してみるわけですが、
\begin{array}{rlc} \displaystyle A&=A^{\dagger} \\ \\ B&=B^{\dagger} \end{array}
\begin{array}{rlc} \displaystyle \langle | A-ixB |^2 \rangle&≥0 \\ \\ \\ \langle | A-ixB |^2 \rangle &=\langle (A-ixB)^{\dagger}(A-ixB) \rangle \\ \\ &=\langle (A^{\dagger}+ixB^{\dagger})(A-ixB) \rangle \\ \\ &=\langle A^2-i(AB-BA)x+B^2x^2 \rangle \\ \\ \\ &=\langle A^2\rangle-\langle i(AB-BA)x\rangle+\langle B^2x^2 \rangle \\ \\ &=\langle A^2\rangle-\langle i(AB-BA)\rangle x+\langle B^2 \rangle x^2 \end{array}
まあ 2次方程式の形はこのようになるので、
後は係数を整理して、
\begin{array}{rlc} \displaystyle ax^2+bx+c&=0 \\ \\ x&\displaystyle =\frac{-b±\sqrt{b^2-4ac}}{2a} \\ \\ \\ a&=\langle B^2 \rangle \\ \\ b&=-\langle i(AB-BA)\rangle \\ \\ c&=\langle A^2\rangle \end{array}
実数解の存在を考慮すると、
y≥0 のパターンでは重解以外は存在しないので、
\begin{array}{lll} \displaystyle x&=\mathrm{Real\,\,Number} \\ \\ \langle i[A,B]\rangle &=\mathrm{Real\,\,Number} \end{array}
\begin{array}{lll} \displaystyle b^2-4ac&≤0 \\ \\ \Bigl( -\langle i(AB-BA)\rangle \Bigr)^2-4\langle B^2 \rangle \langle A^2\rangle&≤0 \\ \\ \\ \Bigl( -\langle i[A,B] \rangle \Bigr)^2-4\langle B^2 \rangle \langle A^2\rangle&≤0 \\ \\ \Bigl|\langle i[A,B] \rangle \Bigr|^2-4\langle B^2 \rangle \langle A^2\rangle&≤0 \end{array}
こうなります。
んで、「絶対値の性質」と
「エルミート演算子の性質」を考えると、
\begin{array}{rlc} i[A,B] |\psi\rangle&= r |\psi\rangle \\ \\ \\ \Bigl|\langle i[A,B] \rangle \Bigr| &=\Bigl|\langle \psi| i[A,B] |\psi \rangle \Bigr| \\ \\ &=\Bigl|\langle \psi| r |\psi \rangle \Bigr| \\ \\ &=|\langle r\rangle| \\ \\ &=|r| \\ \\ &=\sqrt{r^*r} \\ \\ &=\sqrt{r^2} \\ \\ \\ \Bigl|\langle [A,B] \rangle \Bigr| &=\Bigl|\langle\psi| (-i)i[A,B] |\psi\rangle \Bigr| \\ \\ &=\Bigl|\langle\psi| (-i)r |\psi\rangle \Bigr| \\ \\ &=|\langle (-i)r \rangle | \\ \\ &=|-ir| \\ \\ &=\sqrt{(-ir)^{*}(-ir)} \\ \\ &=\sqrt{(ir)(-ir)} \\ \\ &=\sqrt{r^2} \end{array}
\begin{array}{rlc} \displaystyle \Bigl|\langle i[A,B] \rangle \Bigr|&=\Bigl|\langle [A,B] \rangle \Bigr| \end{array}
このようになることが分かるので、
↓のように変形。
\begin{array}{lll} \displaystyle \Bigl|\langle [A,B] \rangle \Bigr|^2-4\langle B^2 \rangle \langle A^2\rangle&≤0 \end{array}
\begin{array}{lll} \displaystyle \Bigl|\langle [A,B] \rangle \Bigr|^2&≤4\langle B^2 \rangle \langle A^2\rangle \\ \\ \\ 4\langle B^2 \rangle \langle A^2\rangle &≥\Bigl|\langle [A,B] \rangle \Bigr|^2 \end{array}
すると、↓のような式が導かれます。
\begin{array}{rlc} \displaystyle \langle A^2\rangle \langle B^2 \rangle&\displaystyle ≥\frac{1}{4} \Bigl|\langle [A,B] \rangle \Bigr|^2 \\ \\ \sqrt{\displaystyle \langle A^2\rangle } \sqrt{\displaystyle \langle B^2 \rangle }&\displaystyle ≥\frac{1}{2} \Bigl|\langle [A,B] \rangle \Bigr| \end{array}
最後に「偏差」や「分散」などの
「統計的な感覚」を考えると、
\begin{array}{lll} \displaystyle ΔA&=A-\langle A\rangle \\ \\ ΔB&=B-\langle B\rangle \\ \\ \\ [ΔA,ΔB]&=[A,B] \\ \\ \\ σ^2(A)&=\langle ΔA^2 \rangle \end{array}
結果として、
↓のような不等式が導かれる、と。
\begin{array}{llc} \displaystyle \sqrt{\displaystyle \langle A^2\rangle } \sqrt{\displaystyle \langle B^2 \rangle }&\displaystyle ≥\frac{1}{2} \Bigl|\langle [A,B] \rangle \Bigr| \\ \\ \sqrt{\displaystyle \langle ΔA^2\rangle } \sqrt{\displaystyle \langle ΔB^2 \rangle }&\displaystyle ≥\frac{1}{2} \Bigl|\langle [ΔA,ΔB] \rangle \Bigr| \\ \\ \\ \sqrt{σ^2(A) } \sqrt{σ^2(B) }&\displaystyle ≥\frac{1}{2} \Bigl|\langle [A,B] \rangle \Bigr| \\ \\ \\ σ(A) σ(B)&\displaystyle ≥\frac{1}{2} \Bigl|\langle [A,B] \rangle \Bigr| \end{array}
まあこのような流れで
「ロバートソンの不等式」は導かれるわけです。
まとめると、
「不等式を作るアプローチ」は↓で
\begin{array}{lll} [A,B]&=AB-BA \\ \\ (α+xβ)(α-xβ) &=α^2-(αβ-βα)x-x^2β^2 \\ \\ \\ \displaystyle \langle |A-ixB|^2 \rangle &≥0 \\ \\ b^2-4ac&≤0 \\ \\ \\ ΔA&=A-\langle A\rangle \\ \\ σ^2(A)&=\langle ΔA^2 \rangle \\ \\ [ΔA,ΔB]&=[A,B] \\ \\ \\ \langle A \rangle &=\langle\psi |A |\psi\rangle \\ \\ |z| &=\sqrt{z^{\dagger}z} \\ \\ A^{\dagger}&=A \end{array}
導かれる不等式は↓になります。
\begin{array}{rlc} \displaystyle σ(A)σ(B)&\displaystyle ≥\frac{1}{2}|\langle [A,B] \rangle | \end{array}
これが「ロバートソンの不等式」です。
最後、補足しておくと、
これに「正準交換関係」を入れたものを
\begin{array}{llll} \displaystyle σ(Q)σ(P)&\displaystyle ≥\frac{1}{2}ℏ \end{array}
「ケナードの不等式」と言います。
小澤の不等式
|| 厳密な不確定性関係の式
「不確定性原理の曖昧さ」を解消した式がこれ。
\begin{array}{llc} \displaystyle ε_x η_p+η_p σ_x+σ_p ε_x&\displaystyle ≥\frac{ℏ}{2} \\ \\ \displaystyle ε(Q) η(P)+η(P) σ(Q)+σ(P) ε(Q)&\displaystyle ≥\frac{ℏ}{2} \end{array}
「ロバートソンの不等式」に因む
という点ではハイゼベルグのものと同様なんですが、
\begin{array}{llll} \displaystyle ΔxΔp≒h &→&\displaystyle ΔxΔp=\frac{ℏ}{2} &&(\mathrm{?}) \end{array}
「書き換え」という点で、
小澤の不等式に曖昧な部分はありません。
数式的には完全に正しく、
「測定誤差」も「擾乱」も厳密に定義されています。
ロバートソンの不等式の右側
「交換子」に着目した不等式は、
「正準交換関係」の不等式を導きました。
ということは、
「物理量演算子 A,B 」を置き換えれば、
意味が不確かな『測定の誤差』を
なんらかの方法で厳密に記述できるはず。
と、なんとなくそう思えませんか?
というのも、例えば『誤差』を考えるために、
「観測可能量 A 」として
「観測可能量のズレ ΔA 」を考えると、
\begin{array}{rlc} \displaystyle ΔA&=A^{\prime}-A \\ \\ \displaystyle ΔB&=B^{\prime}-B \end{array}
「ズレた後の観測可能量を A^{\prime} 」とすれば、
こんな感じに表現できます。
\begin{array}{rlc} \displaystyle σ(ΔA)σ(ΔB)&\displaystyle ≥\frac{1}{2}|\langle [ΔA,ΔB] \rangle | \end{array}
その上でロバートソンの不等式を置き換えると
その交換子はこのような不等式を満たすわけで、
なら、交換子の性質を使えば、
物理量演算子の関係を使えば、
『誤差を含む不等式』が得られそうな気がします。
持っていて欲しい性質とエルミート演算子
A,B などは『観測可能量』で考えたいので、
これらの「固有値」は「実数」でなければなりません。
なので A,B,A^{\prime},B^{\prime} を
「エルミート演算子」だと、そう仮定します。
これからの話は↑の話を押さえた上での話になるので、
出てくる行列はエルミート演算子だと考えてください。
予想できる着地点
この時点ではまだゴールは見えません。
というのも、肝心な発想に繋がるものは
\begin{array}{rlc} \displaystyle [A^{\prime},B^{\prime}]&=[A+ΔA,B+ΔB] \end{array}
これを考えた場合の
\begin{array}{rlc} \displaystyle [X+Y,Z]&=[X,Z]+[Y,Z] \\ \\ [X,Y+Z]&=[X,Y]+[X,Z] \end{array}
これなんですよ。
どういうことかというと、
「ロバートソンの不等式」の中には
「標準偏差」が入ってるので、
\begin{array}{rlc} \displaystyle σ(ΔA)&\displaystyle =\sqrt{\displaystyle \langle (ΔA-\langle ΔA \rangle )^2 \rangle} \\ \\ \displaystyle \sqrt{\displaystyle \langle ΔA^2 \rangle}&\displaystyle ≥\sqrt{\displaystyle \langle (ΔA-\langle ΔA \rangle )^2 \rangle} \end{array}
求めたい「誤差」のようなものを考える時、
\begin{array}{rlc} \displaystyle \displaystyle \sqrt{\displaystyle \langle ΔA^2 \rangle}&≥σ(ΔA) \end{array}
「誤差 ΔA の偏差」の「標準偏差」から、
「誤差の標準偏差だけ」を取り出すことができます。
つまり「偏差のような ΔA 」は
「標準偏差の不等式」を考えると
『整理できるかもしれない』わけで、
となると、
なんとなーくうまく整理できる気がしませんか?
\begin{array}{llc} \displaystyle σ(A)σ(B)&\displaystyle ≥\frac{1}{2}|\langle [A,B] \rangle |\\ \\ α&\displaystyle ≥|\langle [A,B] \rangle | \end{array}
「交換子」に着目すれば
そのまま「ロバートソンの不等式」を使って、
\begin{array}{llc} \displaystyle σ(ΔA)σ(ΔB)&\displaystyle ≥\frac{1}{2}|\langle [ΔA,ΔB] \rangle | \\ \\ \displaystyle \displaystyle \sqrt{\displaystyle \langle ΔA^2 \rangle}\displaystyle \sqrt{\displaystyle \langle ΔB^2 \rangle}&\displaystyle ≥\frac{1}{2}|\langle [ΔA,ΔB] \rangle | \end{array}
「不確定性原理の式」に
「似た形の式」を得られそうですし。
測定と交換子の仮定
話は飛びますが、
ここで「同時固有状態」というのを考えます。
この時点じゃ意味不明だと思いますが、
とりあえず「状態が同時に決まるもの」
という感じの「2つのもの」を、
この時点では想像しておいてください。
具体的には「重さ」と「天秤」とか
「温度」と「体積」みたいな。
で、これを確認するとどうなるかって話ですが、
実は「同時固有状態」を考えると、
\begin{array}{rlc} \displaystyle [A^{\prime},B^{\prime}]&=0 \end{array}
「ズレた後の交換子」を↑だと仮定しても
特に問題が無いことが分かるんですよ。
と言ってもまあ
これだけだとよく分からないですよね。
なのでとりあえず、
この「仮定に問題が無い」ことを確認するために
まずいろいろと前提を整理しておきます。
測定で考えられる物理量
「測定」の工程を考えると、
\begin{array}{llc} \displaystyle A&=Q(0) \\ \\ A^{\prime}&=M(Δt) \\ \\ \\ B&=P(0) \\ \\ B^{\prime}&=P(Δt) \end{array}
例えば「位置」と「運動量」なら
最低限、このような物理量が必要だと予想できます。
というのも、
この時の M が「測定するためのもの」で、
「観測する粒子 M の状態」で
「観測したい物理量 P の状態」が測れる時、
例えば「重さ」と「天秤の位置」のように
『連動している』と考えられる時、
\begin{array}{rlc} \displaystyle M\psi_n&=m_n\psi_n \\ \\ P\psi_n&=p_n\psi_n \end{array}
こういう風にできる、という話で、
\begin{array}{rlc} \displaystyle [M,P]&=0 \end{array}
この関係式から、実は↑が導かれるんですよ。
測定と固有状態と交換子
「測定で使う観測可能量を M 」として、
「測定したい観測可能量 P 」を考える場合
\begin{array}{rlc} M | \psi_n \rangle &=m_n | \psi_n \rangle\\ \\ \\ P | \psi_n \rangle &=p_n | \psi_n \rangle \end{array}
「同時固有状態」と言われてるものを使って
このような関係を得ると、
\begin{array}{rlc} [M,P]&=0 \end{array}
実はこのようになります。
「同時固有状態」の話は少し長くなるので
これの詳細は後で話すとして、
\begin{array}{llc} \displaystyle \hat{A}\psi_n&=a_n\psi_n \\ \\ \hat{B}\psi_n&=b_n\psi_n \end{array}
ともかく、↑の関係から交換子を考えると、
\begin{array}{rlc} \hat{A}\hat{B}\psi_n&=\hat{A}b_n\psi_n \\ \\ &=b_n\hat{A}\psi_n \\ \\ &=b_na_n\psi_n \\ \\ \\ \hat{B}\hat{A}\psi_n&=\hat{B}a_n\psi_n \\ \\ &=a_n\hat{B}\psi_n \\ \\ &=a_nb_n\psi_n \\ \\ \\ \hat{A}\hat{B}\psi_n&=\hat{B}\hat{A}\psi_n \end{array}
数式的にはこのようになるわけで、
\begin{array}{rlc} \displaystyle [A^{\prime},B^{\prime}]&=0 \end{array}
ということは、
「同時固有状態」を考える「測定」時には
↑だと考えても特に問題はありません。
まとめると、
「粒子 A の位置を測定したい」時、
「粒子 B の状態が同時に定まる」ことを利用する。
その時「交換子」は↓になる。
\begin{array}{rlc} \displaystyle [A,B]&=0 \end{array}
ということは、
測定時にはこのように仮定できる、と。
まあ以上のことから、
\begin{array}{rlc} \displaystyle [M(Δt),P]&=0 \end{array}
M は「このようになる」ように
「選んで測定される」ことから、
\begin{array}{llll} \displaystyle [A^{\prime},B^{\prime}]&=0 \\ \\ [M(Δt),P]&\displaystyle =0 \end{array}
このように仮定したとしても
特に問題は無い、と言えるわけですね。
交換子の式変形
交換子の式を変形して
[A,B] を取り出してみます。
\begin{array}{rlc} \displaystyle [A^{\prime},B^{\prime}]&=0 \\ \\ A^{\prime}&=A+ΔA \\ \\ B^{\prime}&=B+ΔB \end{array}
『仮定』を用いるとこのようになって、
変数を整理するとこんな感じになりますから、
↓の交換子の性質を考えると、
\begin{array}{rlc} \displaystyle [X+Y,Z]&=(X+Y)Z-Z(X+Y) \\ \\ &=XZ+YZ-(ZX+ZY) \\ \\ &=(XZ-ZX)+(YZ-ZY) \\ \\ &=[X,Z]+[Y,Z] \\ \\ \\ \displaystyle [X,Y+Z]&=X(Y+Z)-(Y+Z)X \\ \\ &=XY+XZ-(YX+ZX) \\ \\ &=(XY-YX)+(XZ-ZX) \\ \\ &=[X,Y]+[X,Z] \end{array}
↓のように分解できることが分かります。
\begin{array}{rlc} \displaystyle [A^{\prime},B^{\prime}]&=0 \\ \\ &=[A+ΔA ,B+ΔB] \\ \\ \\ &=[A+ΔA,B]+[A+ΔA,ΔB] \\ \\ &=[A,B]+[ΔA,B]+[A,ΔB]+[ΔA,ΔB] \end{array}
すると↑の式から、
\begin{array}{rlc} \displaystyle [A,B]+[ΔA,B]+[A,ΔB]+[ΔA,ΔB]&=0 \\ \\ [ΔA,B]+[A,ΔB]+[ΔA,ΔB]&=-[A,B] \end{array}
このような形で
交換子 [A,B] を取り出すことができる、と。
ロバートソンの不等式に寄せていく
「量子」は『確率的に広がっている』ので、
『平均・期待値』を使って統計的に求められます。
加えて「観測可能量」は「行列」で書かれるので、
『大小比較できる形にしたい』なら、
最低限、
『平均・期待値の形』にしておく必要があります。
\begin{array}{rlc} \displaystyle \langle [ΔA,B]+[A,ΔB]+[ΔA,ΔB] \rangle &=\langle -[A,B] \rangle \\ \\ \displaystyle \langle [ΔA,B]\rangle+\langle[A,ΔB]\rangle+\langle[ΔA,ΔB] \rangle &=-\langle [A,B] \rangle \end{array}
加えて「着地したい」のは
「ロバートソンの不等式」ですし、
なにより「複素数」を考えると、
『大小を比較できる形にする』ためには
「実数」へと変換しておく必要があります。
\begin{array}{rlc} \displaystyle \Bigl| \displaystyle \langle [ΔA,B]\rangle+\langle[A,ΔB]\rangle+\langle[ΔA,ΔB] \rangle \Bigr|&=\Bigl| -\langle [A,B] \rangle \Bigr| \\ \\ \displaystyle \Bigl| \displaystyle \langle [ΔA,B]\rangle +\langle[A,ΔB]\rangle +\langle[ΔA,ΔB] \rangle \Bigr|&=\Bigl| \langle [A,B] \rangle \Bigr| \end{array}
なので「絶対値」を使ってこのような形に。
三角不等式と式の比較
「三角不等式」の感覚を使って、
左右の大小を比較してみます。
\begin{array}{llll} x&≥0 \\ \\ y&≥0 \\ \\ \\ \displaystyle x^2+y^2&=z^2 \\ \\ (x+y)^2&=x^2+2xy+y^2 \\ \\(x+y)^2&≥z^2 \\ \\ \\ |x+y|&≥|z| \\ \\ |x|+|y|&≥|z| \end{array}
確認しておくと、
「三角不等式」ってのはこういうやつです。
『三角形の辺の長さの比較をする』要領で、
「大小関係」を得ます。
\begin{array}{lll} \displaystyle |x|+|y|+|z|&=|a| \\ \\ (|x|+|y|+|z|)^2&≥|a|^2 \end{array}
\begin{array}{rlc} \displaystyle \left( \displaystyle \Bigl| \displaystyle \langle [ΔA,B]\rangle \Bigr|+\Bigl|\langle[A,ΔB]\rangle \Bigr|+\Bigl|\langle[ΔA,ΔB] \rangle \Bigr| \right) ^2&≥ \left( \Bigl| \langle [A,B] \rangle \Bigr| \right)^2 \\ \\ \end{array}
使い方についてはまあこんな感じで、
↑から↓の大小関係を導きます。
\begin{array}{rlc} \displaystyle \Bigl| \displaystyle \langle [ΔA,B]\rangle +\langle[A,ΔB]\rangle +\langle[ΔA,ΔB] \rangle \Bigr|&=\Bigl| \langle [A,B] \rangle \Bigr| \\ \\ \displaystyle \Bigl| \displaystyle \langle [ΔA,B]\rangle \Bigr|+\Bigl|\langle[A,ΔB]\rangle \Bigr|+\Bigl|\langle[ΔA,ΔB] \rangle \Bigr|&≥\Bigl| \langle [A,B] \rangle \Bigr| \end{array}
ここまでくると
だいぶ近付いてきた感じがありますね。
変形後の交換子とロバートソンの不等式
↑で導かれた大小関係を、
「ロバートソンの不等式」を当てはめて整理してみます。
\begin{array}{llc} \displaystyle σ(ΔA)σ(ΔB)&\displaystyle ≥\frac{1}{2}|\langle [ΔA,ΔB] \rangle | \\ \\ \displaystyle σ(A)σ(ΔB)&\displaystyle ≥\frac{1}{2}|\langle [A,ΔB] \rangle |\\ \\ \displaystyle σ(ΔA)σ(B)&\displaystyle ≥\frac{1}{2}|\langle [ΔA,B] \rangle | \end{array}
するとまあこんな感じになって、
「交換子より大きなもの」が導けるので、
\begin{array}{llc} \displaystyle 2σ(ΔA)σ(ΔB)&\displaystyle ≥|\langle [ΔA,ΔB] \rangle | \\ \\ \displaystyle 2σ(A)σ(ΔB)&\displaystyle ≥|\langle [A,ΔB] \rangle |\\ \\ \displaystyle 2σ(ΔA)σ(B)&\displaystyle ≥|\langle [ΔA,B] \rangle | \end{array}
\begin{array}{lll} \displaystyle \displaystyle \Bigl| \displaystyle \langle [ΔA,B]\rangle \Bigr|+\Bigl|\langle[A,ΔB]\rangle \Bigr|+\Bigl|\langle[ΔA,ΔB] \rangle \Bigr|&=L \\ \\ \\ \displaystyle \Bigl| \displaystyle \langle [ΔA,B]\rangle \Bigr|+\Bigl|\langle[A,ΔB]\rangle \Bigr|+2σ(ΔA)σ(ΔB)&≥L \\ \\ \displaystyle \Bigl| \displaystyle \langle [ΔA,B]\rangle \Bigr|+2σ(A)σ(ΔB)+2σ(ΔA)σ(ΔB)&≥L\\ \\ \displaystyle 2σ(ΔA)σ(B)+2σ(A)σ(ΔB)+2σ(ΔA)σ(ΔB)&≥L \end{array}
こんな感じに置き換えて、
最終的に↓の関係式を導きます。
\begin{array}{rll} \displaystyle 2σ(ΔA)σ(B)+2σ(A)σ(ΔB)+2σ(ΔA)σ(ΔB)&≥L&≥\Bigl| \langle [A,B] \rangle \Bigr| \\ \\ \displaystyle 2σ(ΔA)σ(B)+2σ(A)σ(ΔB)+2σ(ΔA)σ(ΔB)&&≥\Bigl| \langle [A,B] \rangle \Bigr| \end{array}
\begin{array}{rlc} \displaystyle σ(ΔA)σ(B)+σ(A)σ(ΔB)+σ(ΔA)σ(ΔB)&≥\displaystyle \frac{1}{2}\Bigl| \langle [A,B] \rangle \Bigr| \end{array}
以上が主な式変形ですね。
この時点でほぼ最終形になります。
具体的な観測可能量を入れてみる
なんらかの『粒子の位置』を『間接的』に
『物理量 M で測定した』時、
\begin{array}{llll} \displaystyle 0&→&Δt \\ \\ M(0)&→&M(Δt) \end{array}
「照射」→「衝突」→「反射」→「検知」
までの『時間を Δt とする』なら、
『実際の位置 Q(0) 』と
『測定された位置 M(Δt) 』の間には、
\begin{array}{rlc} \displaystyle ε(Q)&=|Q(0)-M(ΔT)| \end{array}
このような『誤差 ε(Q) がある』
という可能性が考えられます。
もちろん、
「位置の測定が正確である」と仮定するなら、
\begin{array}{rlc} \displaystyle M(Δt)&=Q(0) \end{array}
「誤差は無い」のでこのようになり、
だからこそ↓のように A^{\prime} を定め、
\begin{array}{rlc} \displaystyle A^{\prime}&=M(Δt) \end{array}
これを使って「誤差」を定義します。
標準偏差の意味
「標準偏差」という統計の知識を
念のためざっと確認しておきます。
\begin{array}{rlc} \displaystyle σ^2(X)&\displaystyle =\frac{1}{n} \sum_{i=1}^{n}(X_i-\langle X\rangle )^2 \end{array}
まず「分散」なんですけど
式としてはこんな感じで、
意味は『平均との差』の「2乗平均」ですから
\begin{array}{rlc} \displaystyle (X-\langle X\rangle)^2 \end{array}
この求められた値が
「データのばらつき具合」を表す
と解釈できるのは見て何となくわかると思います。
んで肝心の「標準偏差」についてですけど、
この意味は『偏差の平均』という感じなんですが、
\begin{array}{rlc}ΔX&= \displaystyle X_i-\langle X\rangle \end{array}
↑の『偏差』とはまた別に、
\begin{array}{rlc} \langle X\rangle &\displaystyle =\frac{1}{n}\sum_{i=1}^{n} X_i \\ \\ \displaystyle σ^2(X)&\displaystyle =\frac{1}{n} \sum_{i=1}^{n}(X_i-\langle X\rangle )^2 \\ \\ \displaystyle σ(X)&\displaystyle =\sqrt{ \frac{1}{n} \sum_{i=1}^{n}(X_i-\langle X\rangle )^2 } \end{array}
『分散』を使ってこのように定義されています。
\begin{array}{rlc} ΔX&=\displaystyle X_i-\langle X\rangle \\ \\ \langle ΔX\rangle&=\displaystyle \langle \displaystyle X_i-\langle X\rangle \rangle \\ \\ \\ \displaystyle σ(X)&\displaystyle =\sqrt{ \frac{1}{n} \sum_{i=1}^{n}(X_i-\langle X\rangle )^2 } \\ \\ &=\sqrt{ \langle (X_i-\langle X\rangle )^2 } \rangle \end{array}
見た目に違いはありますが、
仮に「偏差」を↓のようにとった場合、
\begin{array}{rlc} \displaystyle ΔX&=\displaystyle |\displaystyle X_i-\langle X\rangle | \\ \\ \end{array}
これが似たような計算結果を返す
ということはなんとなーくわかると思います。
偏差の標準偏差
不等式で出てくる σ(ΔA) の意味を考えると、
『偏差の標準偏差』って感じになるんですが、
\begin{array}{rlc} ΔA&=\displaystyle A^{\prime}-A \\ \\ σ^2(ΔA)&\displaystyle =\sqrt{ \frac{1}{n} \sum_{i=1}^{n}(ΔA_i-\langle ΔA\rangle )^2 } \\ \\ &\displaystyle =\sqrt{ \frac{1}{n} \sum_{i=1}^{n}\Bigl( (A^{\prime}-A)_i-\langle (A^{\prime}-A)\rangle \Bigr)^2 } \end{array}
実はこれが、
『誤差 ε(Q) 』の形に近いものを導きます。
標準偏差と不等式
うまいこと『誤差 ε(Q) を取り出したい』と考えた時、
↓の式変形を考えると、
\begin{array}{rlc} \langle X \rangle &\displaystyle =\frac{1}{n} \sum_{i=1}^{n} X_i \\ \\ \\ \displaystyle σ^2(X)&\displaystyle = \frac{1}{n} \sum_{i=1}^{n}(X_i-\langle X\rangle )^2 \\ \\ &\displaystyle = \frac{1}{n} \sum_{i=1}^{n}X^{2}_{i} -2\frac{1}{n} \sum_{i=1}^{n}X_i\langle X\rangle +\frac{1}{n} \sum_{i=1}^{n}\langle X\rangle^2 \\ \\ \\ \\ &\displaystyle = \frac{1}{n} \sum_{i=1}^{n}X^{2}_{i} -2\langle X\rangle\langle X\rangle +\langle X\rangle^2 \\ \\ & \displaystyle = \frac{1}{n} \sum_{i=1}^{n}X^{2}_{i} -2\langle X\rangle^2 +\langle X\rangle^2 \\ \\ \\ \\ &\displaystyle = \frac{1}{n} \sum_{i=1}^{n}X^{2}_{i} -\langle X\rangle^2 \end{array}
「誤差と解釈できる \langle ΔX^2 \rangle だけ」を
うまいこと取り出せることが分かります。
というのも、
これは「正の値 r^2 しか使われていない」ので、
\begin{array}{rlc} \displaystyle \frac{1}{n} \sum_{i=1}^{n}X^{2}_{i} &≥\displaystyle \frac{1}{n} \sum_{i=1}^{n}X^{2}_{i} -\langle X\rangle^2 \end{array}
このような関係を導くことができて、
\begin{array}{rlc} \displaystyle \frac{1}{n} \sum_{i=1}^{n}(ΔA)^{2}_{i} &≥\displaystyle \frac{1}{n} \sum_{i=1}^{n}(ΔA)^{2}_{i} -\langle (ΔA)\rangle^2 \\ \\ \displaystyle \frac{1}{n} \sum_{i=1}^{n}(ΔA)^{2}_{i} &≥σ^2(ΔA) \\ \\ \\ \\ \displaystyle \sqrt{\frac{1}{n} \sum_{i=1}^{n}(ΔA)^{2}_{i} }&≥\displaystyle \sqrt{\frac{1}{n} \sum_{i=1}^{n}(ΔA)^{2}_{i} -\langle (ΔA)\rangle^2 } \\ \\ \displaystyle \sqrt{\frac{1}{n} \sum_{i=1}^{n}(ΔA)^{2}_{i} }&≥ σ(ΔA) \\ \\ \displaystyle \sqrt{\langle (ΔA)^{2} \rangle }&≥ σ(ΔA)\end{array}
これをそのまま当てはめれば、
このような形に変形することができます。
まあつまり↓が導けるわけで、
\begin{array}{rlc} \displaystyle \sqrt{\langle (ΔA)^{2} \rangle }&≥ σ(ΔA) \end{array}
これを不等式に当てはめれば、
『誤差と解釈できる値 \langle \sqrt{(ΔA)^2} \rangle 』を
\begin{array}{rlc} \displaystyle σ(ΔA)σ(B)+σ(A)σ(ΔB)+σ(ΔA)σ(ΔB)&≥\displaystyle \frac{1}{2}\Bigl| \langle [A,B] \rangle \Bigr| \end{array}
この式に入れることができます。
測定誤差と擾乱の厳密な定義
式の変形を行っていく過程で、
↓のもの以上に
\begin{array}{rlc} \displaystyle \displaystyle \sqrt{\frac{1}{n} \sum_{i=1}^{n}(ΔA)^{2}_{i} }&≥ σ(ΔA) \\ \\ \displaystyle \sqrt{\langle (ΔA)^{2} \rangle }&≥ σ(ΔA) \end{array}
「誤差を表すもの」として
『適切な形』は作れそうにありません。
ですからここで、
この式自体を『誤差 ε 』『擾乱 η 』として
そのまま定義してしまいます。
\begin{array}{rlc} \displaystyle ε(Q)&≡ \sqrt{\langle ΔQ^2 \rangle} \\ \\ σ(ΔQ) &=\sqrt{\langle ΔQ^2\rangle-\langle ΔQ \rangle^2 } \\ \\ \\ η(P)&≡ \sqrt{\langle ΔP^2 \rangle} \\ \\ σ(ΔP) &=\sqrt{\langle ΔP^2 \rangle-\langle ΔP \rangle^2 } \end{array}
こんな感じに。
確認しておくと、
『測定誤差』および『擾乱』は、
「偏差の二乗平均の平方根」を表しています。
\begin{array}{rlc} \displaystyle \sqrt{\displaystyle \langle (ΔX)^2 \rangle} \end{array}
厳密に言うとごちゃりますが、
これはまあ、要は「偏差の平均に近い値」です。
言い換えるなら、
これは「ズレの平均」に近い値になります。
なのでこれを「誤差」と定義しても、
特に問題はありません。
標準偏差と測定誤差の大小比較
いよいよ大詰めですね。
「小澤の不等式に近い形」を求めていきます。
\begin{array}{rlc} \displaystyle σ(ΔA)σ(B)+σ(A)σ(ΔB)+σ(ΔA)σ(ΔB)&≥\displaystyle \frac{1}{2}\Bigl| \langle [A,B] \rangle \Bigr| \end{array}
\begin{array}{rlc}\displaystyle \frac{1}{n} \sum_{i=1}^{n}X^{2}_{i}&\displaystyle ≥ \sum_{i=1}^{n}X^{2}_{i}-\langle X\rangle^{2} \\ \\ \displaystyle \frac{1}{n} \sum_{i=1}^{n}X^{2}_{i} &≥σ^2(X) \\ \\ \displaystyle \sqrt{\langle X^{2} \rangle }&≥ σ(X) \end{array}
整理しておくと、使うのはこれですね。
\begin{array}{rlc} \displaystyle \displaystyle \sqrt{\langle (ΔA)^{2} \rangle }&≥ σ(ΔA) \\ \\ \displaystyle \sqrt{\langle (ΔB)^{2} \rangle }&≥ σ(ΔB) \end{array}
\begin{array}{rlc} \displaystyle ω(X)&=\sqrt{\langle (ΔX)^{2} \rangle } \end{array}
記号を省略して置き換えておくと
\begin{array}{rlc} \displaystyle σ(ΔA)σ(ΔB)+σ(ΔA)σ(B)+σ(A)σ(ΔB)&≥\displaystyle \frac{1}{2}\Bigl| \langle [A,B] \rangle \Bigr| \\ \\ \displaystyle \textcolor{pink}{ω}(A)\textcolor{skyblue}{ω}(B)+\textcolor{pink}{ω}(A)σ(B)+σ(A)\textcolor{skyblue}{ω}(B)&≥\displaystyle \frac{1}{2}\Bigl| \langle [A,B] \rangle \Bigr| \end{array}
このようになって、
「小澤の不等式」にかなり近い式が得られます。
正準交換関係と小澤の不等式
最後は『位置』と『運動量』を入れて、
「正準交換関係」から式の最終形を求めてみます。
\begin{array}{llc} \displaystyle A&=Q(0) \\ \\ A^{\prime}&=M(Δt) \\ \\ B&=P(0) \\ \\ B^{\prime}&=P(Δt) \end{array}
そのために、変数はこうしましょうか。
\begin{array}{rlc} \displaystyle [Q,P]&=iℏ \\ \\ \displaystyle \frac{1}{2}\Bigl| \langle [Q,P] \rangle \Bigr| &=\displaystyle \frac{1}{2}\Bigl| \langle iℏ \rangle \Bigr| \\ \\ &=\displaystyle \frac{1}{2}\Bigl| iℏ \Bigr| \\ \\ &=\displaystyle \frac{1}{2}ℏ\end{array}
するとまあ正準交換関係はこうなので、
後は『誤差 ε(X) 』『擾乱 η(P) 』へ書き換えれば、
\begin{array}{rlc} \displaystyle ω(Q)&=ε(Q) \\ \\ &=\sqrt{ \langle ΔQ^2 \rangle } \\ \\ &=\sqrt{ \langle (M(Δt)-Q(0))^2 \rangle } \\ \\ \\ ω(P)&=η(P) \\ \\ &=\sqrt{ \langle ΔP^2 \rangle } \\ \\ &=\sqrt{ \langle (P(Δt)-P(0))^2 \rangle }\end{array}
後は入れ替えるだけで、
\begin{array}{rlc} \displaystyle \textcolor{pink}{ω}(A)\textcolor{skyblue}{ω}(B)+\textcolor{pink}{ω}(A)σ(B)+σ(A)\textcolor{skyblue}{ω}(B)&≥\displaystyle \frac{1}{2}\Bigl| \langle [A,B] \rangle \Bigr| \\ \\ \\ \displaystyle \textcolor{pink}{ε}(Q)\textcolor{skyblue}{η}(P)+\textcolor{pink}{ε}(Q)σ(P)+σ(Q)\textcolor{skyblue}{η}(P)&≥\displaystyle \frac{1}{2}ℏ \end{array}
小澤の不等式が導かれます。
まとめると、
「小澤の不等式」は↓です。
\begin{array}{rlc} \displaystyle ε(Q)&=\sqrt{\langle ΔQ^2 \rangle} \\ \\ η(P)&=\sqrt{\langle ΔP^2 \rangle} \end{array}
\begin{array}{rlc} \displaystyle \textcolor{pink}{ε}(Q)\textcolor{skyblue}{η}(P)+\textcolor{pink}{ε}(Q)σ(P)+σ(Q)\textcolor{skyblue}{η}(P)&≥\displaystyle \frac{1}{2}ℏ \end{array}
数学や科学ではよくあることですが、
本来セットで書かれるべきところを
これは単体で書かれることが多いですね。
ただ ε,η の説明と『仮定』の確認は、
この関係式を成す最低限の決まり事なので、
\begin{array}{rlc} \displaystyle ΔQ&=M(Δt)-Q(0) \\ \\ ΔP&=P(Δt)-P(0) \\ \\ \\ \displaystyle ε(Q)&=\sqrt{\langle ΔQ^2 \rangle} \\ \\ η(P)&=\sqrt{\langle ΔP^2 \rangle} \end{array}
\begin{array}{rlc} \displaystyle [M(Δt),P(0)]&=0 \end{array}
\begin{array}{rlc} \displaystyle \textcolor{pink}{ε}(Q)\textcolor{skyblue}{η}(P)+\textcolor{pink}{ε}(Q)σ(P)+σ(Q)\textcolor{skyblue}{η}(P)&≥\displaystyle \frac{1}{2}ℏ \end{array}
↑のように書くのが、
『不確定性関係』を表す厳密な式と言えるでしょう。