一个回归的题目。大家来验验手艺活。

X1、X2、X3、X4分别是:10、20、50、100
Y1、Y2、Y3、Y4分别是:30.5、16.8、7.9、4.8

把回归函数求出来。

[ 本帖最后由 风吹柳 于 2006-3-1 12:33 编辑 ]
我也来说两句 查看全部回复

最新回复

  • aiyinsitan (2006-3-01 12:52:41)

    y = 36.10 - 0.8810x+ 0.005706 x**2

    [ 本帖最后由 aiyinsitan 于 2006-3-1 12:54 编辑 ]
  • high1998 (2006-3-01 14:11:15)

    y = 0.1667x^3 + 1.4x^2 - 19.067x + 48
    R2 = 1
  • high1998 (2006-3-01 14:29:25)

    y =  2.180 + 284.9 /x

    Rsq=99.9%
    Rsq(adj)=99.9%

    [ 本帖最后由 high1998 于 2006-3-1 14:35 编辑 ]
  • 风吹柳 (2006-3-01 14:40:52)

    楼上两位,加分啦。
    虽然艾因老先生没有给出相关系数,应该不会小于0.8。
    问题实际已经有了苗头,从相关系数的角度来看,模型都是适用的。但是到底哪一个正确,还是另有更好的模型。我们在建模的时候,要考虑哪些准则?或者说什么样的模型才是优秀的?
  • 风吹柳 (2006-3-01 14:47:55)

    QUOTE:

    原帖由 high1998 于 2006-3-1 14:29 发表
    y =  2.180 + 284.9 /x

    Rsq=99.9%
    Rsq(adj)=99.9%
    你有两个答案了,由于是单选题。只能选择一个。并说明理由。你要是能把过程粘帖出来就更好了。

    (答案多,也没有分加了。明天再说)
  • xinpeng1 (2006-3-01 15:27:07)

    y=25.9-0.242x
  • high1998 (2006-3-01 16:57:06)

    QUOTE:

    原帖由 风吹柳 于 2006-3-1 14:47 发表


    你有两个答案了,由于是单选题。只能选择一个。并说明理由。你要是能把过程粘帖出来就更好了。

    (答案多,也没有分加了。明天再说)
    第二个应该是更好的.

    理由: 1. 越简单的模型就是越好的. 2. 两个R^2值比较接近,且都很大.

    过程很简单: 将X的值转换成1/X的值,然后用Y与1/X的值回归,再在方程中换回X,就是对X的回归方程.

  • 风吹柳 (2006-3-01 19:01:56)

    QUOTE:

    原帖由 high1998 于 2006-3-1 16:57 发表


    第二个应该是更好的.

    理由: 1. 越简单的模型就是越好的. 2. 两个R^2值比较接近,且都很大.

    过程很简单: 将X的值转换成1/X的值,然后用Y与1/X的值回归,再在方程中换回X,就是对X的回归方程.

    追问,别烦我刨根。

    你是依据什么把X置换为1/X的,为什么不进行其他方式的置换。毕竟还有其它很多种置换方式。千万别说是依据置换后的回归模型简单,因为我们在置换以前,不知道置换后产生的模型到底是什么形式。
  • aiyinsitan (2006-3-01 19:06:19)

    好帖子.
    今天在路上也想了这个问题
    对于回归模型的建立,采取什么样的模式显然对结果的影响是很大的
    从一次,二次,三次,乃至倒数,对数等等方向寻找这个关系
    不知道有没有什么指导性的文件~~~~~~~~~~
  • high1998 (2006-3-01 20:49:42)

    QUOTE:

    原帖由 风吹柳 于 2006-3-1 19:01 发表


    追问,别烦我刨根。

    你是依据什么把X置换为1/X的,为什么不进行其他方式的置换。毕竟还有其它很多种置换方式。千万别说是依据置换后的回归模型简单,因为我们在置换以前,不知道置换后产生的模型到底是什 ...
    回归之前,我们确实不知道方程会是什么样的,我们的培训教材也总是给出一些准备好的数据,然后画出一个老师想要的图形,并解释说这就是回归.当学生们在实践中尝试使用回归时,却感到到处是问题,不能解释.

    1.  为何用1/X?------回归前要先看一下点的大概分布

       先将Y和X画成散点图看一看,会联想到什么函数?

    (有多少培训老师会在讲解回归方法之前,交代要先看一下数据分布形状的?)

    2.  为何越简单越好?------因为越简单的越易用.越有用.

       工程中,工程师是以解决问题,产品质量稳定为第一要务;让现场人员控制好一个简单的参数,其难度和成本都很低,犯错误的机会也少.而要控制一个复杂的参数,就不是想象的那么容易了.这是为何模型要越简单越好的原因.

    而喜欢数学的人总是喜欢将形式的东西搞得很完美,但不能解决实际问题.现实中很少能碰到Rsq(adj)能到99.9%的,能到80%就不错了.

    3. 为何说这个模型好?------拟合得好.

       除了模型简单以外,R^2和R^2(adj)高低是判别模型拟合好坏的依据.百分比高且两者很近,意味着模型能解释的数据多,换句话说,不符合模型的点越少.

    4. 从数学上讲,可以满足上述四组点的方程不止一个,其他方程也可以做到拟合的百分比很高(我在三楼贴的三次方程拟合也很好),复杂的方程于实际使用有何意义呢?

    有人曾经总结过什么形状的分布用什么样的函数回归,跟高等数学上讲的差不多.有兴趣的自己翻翻书就可以找到答案了.

  • 风吹柳 (2006-3-01 23:52:21)

    QUOTE:

    原帖由 high1998 于 2006-3-1 20:49 发表


    回归之前,我们确实不知道方程会是什么样的,我们的培训教材也总是给出一些准备好的数据,然后画出一个老师想要的图形,并解释说这就是回归.当学生们在实践中尝试使用回归时,却感到到处是问题,不能解释.

    1.  为 ...
    正确的模型有5个特点(或者说至少有5个特点),关键的基本上都被你说到了。我再补充3点,把它补全了。(本来想在等等的)。
    正确的模型有五点(并不是绝对的标准,大家犯不着为这个批我)
    1、与理论相吻合。
    2、提供了一个优异的拟合。但这只是必要条件,假如有N次回归(N趋近于无穷大的话),任何XY的拟合系数都会相当好。
    3、参数少,形式简单。复杂了的拟合在实践中使用起来往往相当困难。
    4、模型参数具有实际三物理意义。这一点比较好,我喜欢。
    5、内插值很可能有效。这就有实际意义了。回归模型建立的目的是什么,往往就是要找内插值。

    回归是一个很有力的工作,我们曾开玩笑讲,把回归和方差分析工具掌握透彻了,其他的工具都是小kiss了。

    在回归分析(工具使用)中,还有几个注意事项。今天就不说了,说多了记不住,印象也不深。

    感谢回帖的几位道友,回帖 人少了,我缺乏发帖的激情。给我加分的话,俺的激情就无止境了。


    [ 本帖最后由 风吹柳 于 2006-3-1 23:53 编辑 ]
  • 一剪梅. (2006-3-02 08:13:28)

    几次手痒都想尝试做下,又见楼上各位都是高手,有心想等等的,早早来到办公室立即打开这个帖,偶来迟了

    "回归是一个很有力的工作,我们曾开玩笑讲,把回归和方差分析工具掌握透彻了,其他的工具都是小kiss了".楼主的话偶记住了

    感染于楼主激发大家学习的激情,分分送上
  • high1998 (2006-3-02 08:18:12)

    QUOTE:

    原帖由 风吹柳 于 2006-3-1 23:52 发表


    正确的模型有5个特点(或者说至少有5个特点),关键的基本上都被你说到了。我再补充3点,把它补全了。(本来想在等等的)。
    正确的模型有五点(并不是绝对的标准,大家犯不着为这个批我)
    1、与理论相吻合。 ...
    贴上图来说明就很清楚了.

  • tpp1108 (2006-3-03 12:40:41)

    不会呀,没办法,我笨呀,要学习
  • aiyinsitan (2006-3-03 12:58:33)

    回去研究课本,原来对自变量的取值存在很深的学问

    倒数只是其中之一,还有对数,开方~~~~~~~~~~~`
  • high1998 (2006-3-03 13:14:41)

    QUOTE:

    原帖由 tpp1108 于 2006-3-3 12:40 发表
    不会呀,没办法,我笨呀,要学习
    也许你现在真的还不会,你不是可以在网上学吗?这就是办法啊,怎么说没办法呢?
    你知道上网学,这就很聪明了,也不笨.
    我们都要学习,说对了.
  • 风吹柳 (2006-3-06 09:51:31)

    QUOTE:

    原帖由 aiyinsitan 于 2006-3-3 12:58 发表
    回去研究课本,原来对自变量的取值存在很深的学问

    倒数只是其中之一,还有对数,开方~~~~~~~~~~~`
    a大师,把你的研究结果给我授授,很虚心的说
  • aiyinsitan (2006-3-06 10:03:07)

    过谦了~~~~`
    通常通过对残差的图形分析,如果观察值的方差随着X轴的推移而出现规律性变化(比如漏斗,双面弓,v字形状等),这时候就要考虑对响应Y进行数据变换来消除这个问题,广泛使用的方差稳定变换一般是根号Y,lny,1/y

    Montgomert,Pech 和Vining
  • 蚂蚁 (2006-3-06 10:49:00)

    回归尽量取简单的构造是在不影响结果的前提下,有时侯在精确的场合或结果误差较大时,必须采用较精确的回归模型。另外数据的多少有时候也可能是的出现多种你和较好的模型,而我们是无法准确推断的,这时候能做的就是适当增加实验样本以期获得更精确的模型。

    针对柳哥的数据,是否可以考虑一下做对数变换呢?

    1.对Y取对数,并作二次回归模型


    Image1.jpg


    2.对X、Y取对数,并作一次回归模型


    Image2.jpg


    3.对X、Y取对数,并作二次回归模型


    Image3.jpg



    [ 本帖最后由 蚂蚁 于 2006-3-6 10:51 编辑 ]
  • 风吹柳 (2006-3-06 12:53:57)

    QUOTE:

    原帖由 蚂蚁 于 2006-3-6 10:49 发表
    回归尽量取简单的构造是在不影响结果的前提下,有时侯在精确的场合或结果误差较大时,必须采用较精确的回归模型。另外数据的多少有时候也可能是的出现多种你和较好的模型,而我们是无法准确推断的,这时候能做的就 ...
    这个帖子把你给调出来了。好,很好;
    老天,两个100%都被你弄出来了。一定要加分。

    不能白拿我的分,你计算出几个你和公式,你认为哪个最好。就是说你只能选择一个,你选哪个?