通过前面的介绍,我们已经初步认识到了DOE的强大分析功能。但是有的读者可能会不以为然:在此之前的两个案例中因子的数量太少(只有3个),而实际需要解决的问题会复杂得多,涉及的因子数量也可能会很多(至少有
|
|
这个结论显然有失偏颇,其实DOE的一大特点就是可以处理包含多达50个(并不限于50个)因子的复杂问题,本期的主要内容就是向读者介绍多因子DOE的方法。
从理论上讲,上一期的DOE案例实质上采用的是完全因子设计(Full Factorial Design),这类方法在因子数量较少的时候实施起来比较方便。但是正如表一所示,当试验中的因子数量逐步增加时,试验次数却呈指数增加,庞大的试验规模意味着巨额的试验费用,意味着实施DOE的可行性越来越小。
|
因子数量 |
试验次数 |
|
2 |
4 |
|
3 |
8 |
|
4 |
16 |
|
5 |
32 |
|
6 |
64 |
|
7 |
128 |
|
8 |
256 |
|
9 |
512 |
|
10 |
1024 |
|
… |
… |
为了解决这个矛盾,我们可以用一种更具魅力的方法——部分因子设计(Fractional Factorial Design)来替代一般的完全因子设计。顾名思义,部分因子设计源于完全因子设计,是与其对应的完全因子设计中的一部分。但究竟是哪一部分,是否可以随机选取?举一个简单的例子来说明。
表二显示的是一个完全因子设计的计划表,A、B和C表示三个主因子,+1和-1表示因子的两个不同水平,AB、AC和BC表示二阶交互作用,ABC表示三阶交互作用,总共需要做8次不同的水平组合来完成1次完全因子设计的计划。
|
Run |
A |
B |
C |
AB |
AC |
BC |
ABC |
|
1 |
-1 |
-1 |
-1 |
1 |
1 |
1 |
-1 |
|
2 |
1 |
-1 |
-1 |
-1 |
-1 |
1 |
1 |
|
3 |
-1 |
1 |
-1 |
-1 |
1 |
-1 |
1 |
|
4 |
1 |
1 |
-1 |
1 |
-1 |
-1 |
-1 |
|
5 |
-1 |
-1 |
1 |
1 |
-1 |
-1 |
1 |
|
6 |
1 |
-1 |
1 |
-1 |
1 |
-1 |
-1 |
|
7 |
-1 |
1 |
1 |
-1 |
-1 |
1 |
-1 |
|
8 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
|
Run |
A |
B |
C |
D |
AB |
AC |
BC |
ABC(=D) |
|
1 |
-1 |
-1 |
-1 |
-1 |
1 |
1 |
1 |
-1 |
|
2 |
1 |
-1 |
-1 |
1 |
-1 |
-1 |
1 |
1 |
|
3 |
-1 |
1 |
-1 |
1 |
-1 |
1 |
-1 |
1 |
|
4 |
1 |
1 |
-1 |
-1 |
1 |
-1 |
-1 |
-1 |
|
5 |
-1 |
-1 |
1 |
1 |
1 |
-1 |
-1 |
1 |
|
6 |
1 |
-1 |
1 |
-1 |
-1 |
1 |
-1 |
-1 |
|
7 |
-1 |
1 |
1 |
-1 |
-1 |
-1 |
1 |
-1 |
|
8 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
场景 : ACB公司是一家网络公司,主要为个人用户提供服务。近阶段以来公司网站的点击数总体偏低,排名在同行业中持续下滑,高层管理层决定通过一个DOE项目找到少数几个关键因素,提高公司网站的每周访问量。经过初步分析,项目团队发现关键词的个数、关键词的类型、URL标题、每周的更新频率、关键词在标题中的位置和免费礼物是最具可能性的关键因子。但是如果按传统的完全因子设计的思路,至少要做26=64次试验,项目的时间跨度超过一年,分析结果的价值性大大降低,有什么好办法来克服这个困难呢?
显然,这个案例用部分因子设计的DOE来实现是再合适不过了。针对已知的6个关键因子,各取两个最具代表性的水平值,鉴于该项目的主要目的是寻找关键因子,选择筛选效率最高的设计方案26-3(=8),不同水平组合时分别运行1周,八周后统计相应的点击数量,结果如表四所示。
|
URL标题 |
关键词的个数 |
关键词的类型 |
每周的更新频率 |
关键词在标题中的位置 |
免费礼物 |
点击数 |
|
短 |
5 |
旧 |
4 |
第70个字符 |
有 |
5083 |
|
长 |
5 |
旧 |
1 |
第40个字符 |
有 |
2272 |
|
短 |
10 |
旧 |
1 |
第70个字符 |
无 |
2012 |
|
长 |
10 |
旧 |
4 |
第40个字符 |
无 |
4328 |
|
短 |
5 |
新 |
4 |
第40个字符 |
无 |
6359 |
|
长 |
5 |
新 |
1 |
第70个字符 |
无 |
3676 |
|
短 |
10 |
新 |
1 |
第40个字符 |
有 |
4779 |
|
长 |
10 |
新 |
4 |
第70个字符 |
有 |
6549 |
论坛讨论:
TAG: DOE Doe 魅力




最新评论
删除 引用 wuyuetian (2008-6-21 18:23:34, 评分: 0 )
删除 引用 lly0608 (2008-6-01 19:00:35, 评分: 0 )
删除 引用 洛客 (2008-6-01 06:59:42, 评分: 0 )
删除 引用 天堂之吻 (2008-6-01 01:05:20, 评分: 0 )
??????????
"其实,如果你有一些实践经验,就可能理解了,反正我是如此的。"
你的意思是,根据经验选择出的这8个筛选效率最高的组合吗?意思就是,我们根据以往的经验,知道就是8个这样的组合是关键的影响?
^_^
删除 引用 Yigle (2008-5-30 16:44:54, 评分: 0 )
首先来说为什么简单。
DOE的目的是什么?若只想找出每个因子的较好水平组合,那么建立一个线性而粗糙的涵数关系就足够了。所以,从这个角度来说,选择这样的试验方案是最为理想不过的了。若因子影响呈非线性,且要非常精确的组合水平,那非得做解析度至少4级以上的DOE不可,如全因子试验、RSM等。
接下来说为什么复杂。
其实对于这一点,我一直认为,是因为直交表太复杂的缘故,不好理解和解释,加之混淆概念不易弄懂,所以不少人感觉把简单的事情复杂化了。其实,如果你有一些实践经验,就可能理解了,反正我是如此的。
删除 引用 angelo.han (2008-5-30 16:25:07, 评分: 0 )
删除 引用 天堂之吻 (2008-5-29 23:04:10, 评分: 0 )
依据什么选择的那8个水平组合呢?
请知道的高手,指点一下吧,谢谢! ^_^