p*******r 发帖数: 4048 | 1 嗯,应该也算,我觉得可能用Bayesian说得比较清楚。
命题是
P(白色|天鹅)=1
你也可以证明
P(非天鹅|非白色)=1
黑乌鸦是
P(非天鹅,非白色)+=some value;
but P(非天鹅|非白色)=P(非天鹅,非白色)|P(非白色)
P(非白色)很大,所以这个数据作用不大。
相反
P(天鹅)很小,所以P(白色,天鹅)+=some value 的作用很大。 | H****h 发帖数: 1037 | 2 虽然两个命题在逻辑上是等价的,但是它们在不完全归纳的意义
上是不平等的。如果世界上大概有一百万只天鹅,那么每发现一
只白色的天鹅就是对天鹅都是白色的的百万分之一的支持论据。
但是反过来,不是白色的物体的数量则非常非常地大,简直可以
说是无穷,知道任何一个这样物体不是天鹅,对于命题的贡献
远远小于百万分之一。实际上几乎为0。 | o*****e 发帖数: 435 | 3 看来两位的观点:
是有支持作用但是支持作用很小.
但是:
1. "所有天鹅都是白色的"是个SCIENTIFIC LAW,我们不仅仅只考虑到现在,
即我们假设天鹅的数目很可能是无限的.
2. 我们稍微修改一下: 如果我们又发现了一只红色的乌鸦呢?
该观察对"所有天鹅都是白色的"有支持作用,虽然很小
但是问题来了:
观察到一只红色的乌鸦对"所有天鹅都是黑色的", 也有支持作用,
虽然很小;即,观察到一只红色的乌鸦对"所有天鹅都是黑色的"
以及""所有天鹅都是白色的"都有支持作用.
不是吗?
我们假设
【在 p*******r 的大作中提到】 : 嗯,应该也算,我觉得可能用Bayesian说得比较清楚。 : 命题是 : P(白色|天鹅)=1 : 你也可以证明 : P(非天鹅|非白色)=1 : 黑乌鸦是 : P(非天鹅,非白色)+=some value; : but P(非天鹅|非白色)=P(非天鹅,非白色)|P(非白色) : P(非白色)很大,所以这个数据作用不大。 : 相反
| u*h 发帖数: 397 | 4 有一个小圈套:
黑色的乌鸦支持的如下命题:
所有不是白色的, 都不是天鹅.
该命题是原命题的逆否命题, 等价.
所以
黑色的乌鸦也是原命题的支持性证据.
我记得以前有一片文章讲过这个问题.
【在 o*****e 的大作中提到】 : 看来两位的观点: : 是有支持作用但是支持作用很小. : 但是: : 1. "所有天鹅都是白色的"是个SCIENTIFIC LAW,我们不仅仅只考虑到现在, : 即我们假设天鹅的数目很可能是无限的. : 2. 我们稍微修改一下: 如果我们又发现了一只红色的乌鸦呢? : 该观察对"所有天鹅都是白色的"有支持作用,虽然很小 : 但是问题来了: : 观察到一只红色的乌鸦对"所有天鹅都是黑色的", 也有支持作用, : 虽然很小;即,观察到一只红色的乌鸦对"所有天鹅都是黑色的"
| l*******n 发帖数: 157 | 5 逻辑上等价于 != 支持命题
【在 o*****e 的大作中提到】 : 看来两位的观点: : 是有支持作用但是支持作用很小. : 但是: : 1. "所有天鹅都是白色的"是个SCIENTIFIC LAW,我们不仅仅只考虑到现在, : 即我们假设天鹅的数目很可能是无限的. : 2. 我们稍微修改一下: 如果我们又发现了一只红色的乌鸦呢? : 该观察对"所有天鹅都是白色的"有支持作用,虽然很小 : 但是问题来了: : 观察到一只红色的乌鸦对"所有天鹅都是黑色的", 也有支持作用, : 虽然很小;即,观察到一只红色的乌鸦对"所有天鹅都是黑色的"
| v*******e 发帖数: 1715 | 6 有理有理.--这篇写的最清楚和最到点上.尤其说明在不完全归纳的意义
上是不平等的.
其实这个问题就是抽样检验问题,工厂生产零件,你要抽>2%做检验,
这样对"全合格",就有一个置信度. 置信度也就是支持程度.
所以这个比例很重要.
而A=>B ~B=>~A,明确说,往往A和~B的数目中,其中一个必为无穷(如果A+~A是指所有事物,
而自然数目无穷的话).这个时候,要实验检验或支持,只能从有限的那部分去找证据支持.
【在 H****h 的大作中提到】 : 虽然两个命题在逻辑上是等价的,但是它们在不完全归纳的意义 : 上是不平等的。如果世界上大概有一百万只天鹅,那么每发现一 : 只白色的天鹅就是对天鹅都是白色的的百万分之一的支持论据。 : 但是反过来,不是白色的物体的数量则非常非常地大,简直可以 : 说是无穷,知道任何一个这样物体不是天鹅,对于命题的贡献 : 远远小于百万分之一。实际上几乎为0。
| v*******e 发帖数: 1715 | 7 这里谈了抽样检验,主要是抽样比例和置信度(支持度)的关系.这是
对命题的支持.
还一种是对实用的支持.则和比例无关.
比如你见过100个天天鹅,都是白的,那么,在相同环境下,你认为天鹅
都是白的,出错的可能<1/100.
相同,你选了100个不是白的,结果都不是天鹅,那么,你继续以相同方法选,
只要不是白的,你可以认为都不是天鹅,你可以相信出错的机会<1/100.
这样,比例其实隐藏在你以相同方法选东西的过程中.
但这种实用原则的支持,注重的是出错概率,而不是对原命题的支持.
判断出错的概率和对命题支持的程度分离,是我这里要说的.
...这样说可以么?
【在 v*******e 的大作中提到】 : 有理有理.--这篇写的最清楚和最到点上.尤其说明在不完全归纳的意义 : 上是不平等的. : 其实这个问题就是抽样检验问题,工厂生产零件,你要抽>2%做检验, : 这样对"全合格",就有一个置信度. 置信度也就是支持程度. : 所以这个比例很重要. : 而A=>B ~B=>~A,明确说,往往A和~B的数目中,其中一个必为无穷(如果A+~A是指所有事物, : 而自然数目无穷的话).这个时候,要实验检验或支持,只能从有限的那部分去找证据支持.
| H****h 发帖数: 1037 | 8 你举的两个例子确实是对于相应命题的等效支持。
看来我的前一篇帖子有些问题。
现在看来问题出在命题的精确性上。
如果要从非白色物体不是天鹅,推断出天鹅是白色的,
我们就会损失精确度。我大致估计,如果非白色物体
的个数位N,天鹅个数为n,已知非白色物体不是天鹅
这个命题的误差为s,即可信度为1-s。则天鹅是白色
的误差约为s*N/n。我承认不懂得统计,以上说法纯属
于猜测。如果恰好使用了统计概念,可能用得也不对。
事物,
持.
【在 v*******e 的大作中提到】 : 这里谈了抽样检验,主要是抽样比例和置信度(支持度)的关系.这是 : 对命题的支持. : 还一种是对实用的支持.则和比例无关. : 比如你见过100个天天鹅,都是白的,那么,在相同环境下,你认为天鹅 : 都是白的,出错的可能<1/100. : 相同,你选了100个不是白的,结果都不是天鹅,那么,你继续以相同方法选, : 只要不是白的,你可以认为都不是天鹅,你可以相信出错的机会<1/100. : 这样,比例其实隐藏在你以相同方法选东西的过程中. : 但这种实用原则的支持,注重的是出错概率,而不是对原命题的支持. : 判断出错的概率和对命题支持的程度分离,是我这里要说的.
| o*****p 发帖数: 2977 | 9 如果"白色/黑色"和"天鹅/乌鸦"可以分别独立判断(不通过颜色既可
判断天鹅/乌鸦)
那看见一支白色还是黑色乌鸦都不曾加"天鹅是白色"这个命题的支持度--
哪怕通过offside的逻辑。
所以你门三个都有问题,没抓住重点。
用另一种说法
所有天鹅都有胃
你认为能通过解剖一支乌鸦来增加对这个命题的支持么?
【在 v*******e 的大作中提到】 : 这里谈了抽样检验,主要是抽样比例和置信度(支持度)的关系.这是 : 对命题的支持. : 还一种是对实用的支持.则和比例无关. : 比如你见过100个天天鹅,都是白的,那么,在相同环境下,你认为天鹅 : 都是白的,出错的可能<1/100. : 相同,你选了100个不是白的,结果都不是天鹅,那么,你继续以相同方法选, : 只要不是白的,你可以认为都不是天鹅,你可以相信出错的机会<1/100. : 这样,比例其实隐藏在你以相同方法选东西的过程中. : 但这种实用原则的支持,注重的是出错概率,而不是对原命题的支持. : 判断出错的概率和对命题支持的程度分离,是我这里要说的.
| wy 发帖数: 14511 | 10 Let me refresh: puppeteer的方向我认为是正确的,
为什么呢?因为原问题问的是:对于一个测试结果,
我们对一个hypothesis的confidence是否有变化?
怎么去量化这个confidence? probability, only probability.
Now let's rewrite the problem as following:
S(x)=an object x is a swan.
W(x)=an object x is white.
NOTE S(x) and W(x) are independent.
Then hypothesis becomes:
H(x)=S(x)->W(x). NOTE for soem ppl know nothing about probability:
H(x) holds true once S(x) is false.
I define the confidence to H(x) as P(H(x))=P(S(x)->W(x)).
Note P(H(x))=P((NOT W(x))->(NOT S(x
【在 H****h 的大作中提到】 : 你举的两个例子确实是对于相应命题的等效支持。 : 看来我的前一篇帖子有些问题。 : 现在看来问题出在命题的精确性上。 : 如果要从非白色物体不是天鹅,推断出天鹅是白色的, : 我们就会损失精确度。我大致估计,如果非白色物体 : 的个数位N,天鹅个数为n,已知非白色物体不是天鹅 : 这个命题的误差为s,即可信度为1-s。则天鹅是白色 : 的误差约为s*N/n。我承认不懂得统计,以上说法纯属 : 于猜测。如果恰好使用了统计概念,可能用得也不对。 :
| | | v*******e 发帖数: 1715 | 11
的确,可以批个定义不明.
"an object x is a swan"是什么? 是一个可以赋值的东西么?!
也许是说:"an object x is a swan的概率"..还象个话,因为概率是个数值.
但哪怕如此,正确的符号是P(x=swan),当x是整个空间取样得唯一关心的观察变量.
也可以简化为P(swan)或P(S) .这就是prior probability,是PUPP前面用的.
这里用了S(x),其实是P(x=S),或简称P(S)...这种符号一看就觉得不专业.也不对,
一般S(x)是指x的分布函数,这样X算个变量.
至于独立,简单,如果不说明,就是说概率独立(相对统计独立).P(s).P(w)=P(s,w)
【在 H****h 的大作中提到】 : 你举的两个例子确实是对于相应命题的等效支持。 : 看来我的前一篇帖子有些问题。 : 现在看来问题出在命题的精确性上。 : 如果要从非白色物体不是天鹅,推断出天鹅是白色的, : 我们就会损失精确度。我大致估计,如果非白色物体 : 的个数位N,天鹅个数为n,已知非白色物体不是天鹅 : 这个命题的误差为s,即可信度为1-s。则天鹅是白色 : 的误差约为s*N/n。我承认不懂得统计,以上说法纯属 : 于猜测。如果恰好使用了统计概念,可能用得也不对。 :
| o*****e 发帖数: 435 | 12 Four questions:
1. Here S and W are predicates, x is a Variable.
The value of S(x) is either true or flase, which means x is either
a swan or not.
The hyposthesis should be writen in this way:
H(x)=(ANY x)(S(x)->W(x))
2. More accurately, the confidence P(H(x)) should be P(H(x0 | K), where K
is the background knowledge.
3. I think the key point is here. We only have K, not the entire knowledge.
In other words, it should be P((ANY x)(S(x)) | K).
So I doubt your definitio
【在 wy 的大作中提到】 : Let me refresh: puppeteer的方向我认为是正确的, : 为什么呢?因为原问题问的是:对于一个测试结果, : 我们对一个hypothesis的confidence是否有变化? : 怎么去量化这个confidence? probability, only probability. : Now let's rewrite the problem as following: : S(x)=an object x is a swan. : W(x)=an object x is white. : NOTE S(x) and W(x) are independent. : Then hypothesis becomes: : H(x)=S(x)->W(x). NOTE for soem ppl know nothing about probability:
| wy 发帖数: 14511 | 13 en, 就算是自然语言--英语汉语之类
有能力描述任何逻辑问题--基本上我认为
这确实理论可行.不过,我还是认为,
在这些问题上,还是使用数学这个强大的
工具更容易把一件事说明白.尤其是这个话题的
原问题.
数学,现在比较失败的是表达一些模糊概念,
比如说I love you so much! 这个so much
怎么表示就不是很容易.
假如我们生存在一个数学语言成为日常用语之一的
世界,换句话说就是女的听见有任用公式去说i love u
也不感觉weird的世界, 注意:这事个人看来完全就是
一个心理问题--当前世界的人因为不容易理解数学语言
而不习惯. 如果一个人说P(I love u)=1,并且配合
表情动作,我认为,并非不可理解. 但是,诸如
"风轻轻的吹,也沉沉的睡"之类,恐怕目前为止不是
数学语言能够担当的任务?
不过对于原问题,我认为不使用数学工具,而像
禅宗大师一样胡说八道,简直就是撒呓症--这句话对文科生除外. | o**o 发帖数: 3964 | 14 哈哈,还在讨论这个问题!:)
如果真愿意用概率来解释(因此答案就不唯一,因为人人都是自己的Bayesian)这个问题,
我建议精确一点,简单一点,把样本空间定成所有的鸟,当然也可以定义成其他更大的
集合,但是那样黑碟子和黑乌鸦的作用是一样的。好了,定义样本空间是鸟,假设鸟就
只有两种,天鹅和乌鸦,再假设鸟就两种颜色,白色和黑色。这样基本不改变原题的用
意。然后可以计算在观测到一个黑乌鸦(两个变量颜色=黑,种类=乌鸦)以后,是否改变
P(白色|天鹅)=p 的值。因为后者是在天鹅这个子空间上的概率,我直觉倾向于认为不应
该改变(假如支持,白乌鸦为什么不支持?),但是注意种类这个变量的两个可能性不是
独立的(非此即彼),需要核算一下,等会儿写个严格一点的推倒过程。 | h**********a 发帖数: 40 | 15 1)
显然不能(也不需要)假设两个变量独立。假设
p00:= Pr(白天鹅) p01:=Pr(白乌鸦) p10:=Pr(黑天鹅) p11:=Pr(黑乌鸦)
四个p加起来等于1
现在你观察到的样本个数分别为 X00只白天鹅, X01只白乌鸦, X10只黑天鹅, X11只黑乌鸦
你需要估计的条件概率为 Pr(白|天鹅)=p00/(p00+p10) 是(p00, p10)的函数
写出likelihood function (是一个Multinomial distribution的pmf)
就知道(X00, X10)是(p00, p10)的充分统计量
所以任何关于(p00, p10) (及其函数)的统计推断都不应依赖于(X01, X11)
2)
这应该是个统计推断问题而不是概率问题。具体到统计推断,它不应该是个估计问题
(即估计Pr(白|天鹅)这个概率参数),而应该是个假设检验问题:
原假设H_0: Pr(白|天鹅)=1, 对立假设H_1: Pr(白|天鹅)<1
在Bayesian看来,任何单点原假设问题都是没有意义的。
3)
我认为用投票的办法来看狠清楚:X00是赞成票,X01, X
【在 o**o 的大作中提到】 : 哈哈,还在讨论这个问题!:) : 如果真愿意用概率来解释(因此答案就不唯一,因为人人都是自己的Bayesian)这个问题, : 我建议精确一点,简单一点,把样本空间定成所有的鸟,当然也可以定义成其他更大的 : 集合,但是那样黑碟子和黑乌鸦的作用是一样的。好了,定义样本空间是鸟,假设鸟就 : 只有两种,天鹅和乌鸦,再假设鸟就两种颜色,白色和黑色。这样基本不改变原题的用 : 意。然后可以计算在观测到一个黑乌鸦(两个变量颜色=黑,种类=乌鸦)以后,是否改变 : P(白色|天鹅)=p 的值。因为后者是在天鹅这个子空间上的概率,我直觉倾向于认为不应 : 该改变(假如支持,白乌鸦为什么不支持?),但是注意种类这个变量的两个可能性不是 : 独立的(非此即彼),需要核算一下,等会儿写个严格一点的推倒过程。
| o*****p 发帖数: 2977 | 16
这里原来health; offside说得挺清楚了,我系统总结一下。
在你的样本空间里,证明(天鹅都是白的)有且只有两种办法
1.抓到所有的天鹅-->发现他门都是白的。
2.抓到所有黑色的物体-->发现他门都不是天鹅。 (逆否命题)
注意任何一个方法都可以证明或证否(天鹅都是白的)的结论
而当你用方法一的时候, 白乌鸦和黑乌鸦是弃权票。这里你是对的。
但当你用方法二的时候,请注意,白乌鸦是弃权票,但黑乌鸦不是--
他门是支持票。(和直觉相反,这里白天鹅是弃权票,黑天鹅还是反对票--
这里认为至少有一支天鹅)。
这是offside在说的。health提出两种证明方法不对称 。
所以,你错了,犯了和我一样的错误。
offside也不是完全没有问题,我觉得不能直接说黑乌鸦是否支持(天鹅都是
白的),因该说,当你想用方法一的时候,他是不支持的,用方法二的时候,
他是支持的。
【在 h**********a 的大作中提到】 : 1) : 显然不能(也不需要)假设两个变量独立。假设 : p00:= Pr(白天鹅) p01:=Pr(白乌鸦) p10:=Pr(黑天鹅) p11:=Pr(黑乌鸦) : 四个p加起来等于1 : 现在你观察到的样本个数分别为 X00只白天鹅, X01只白乌鸦, X10只黑天鹅, X11只黑乌鸦 : 你需要估计的条件概率为 Pr(白|天鹅)=p00/(p00+p10) 是(p00, p10)的函数 : 写出likelihood function (是一个Multinomial distribution的pmf) : 就知道(X00, X10)是(p00, p10)的充分统计量 : 所以任何关于(p00, p10) (及其函数)的统计推断都不应依赖于(X01, X11) : 2)
|
|