Consumer Research Zh 消费者研究
Consumer Research Zh 消费者研究
消费者研究
第二版
“真正的发现之旅,并不在于寻求新的风景,
而在于拥有新的视野。”
Marcel Proust
JMP® 13 消费者研究,第二版
Copyright © 2017, SAS Institute Inc., Cary, NC, USA
2017 年 2 月
SAS® and all other SAS Institute Inc. product or service names are registered trademarks or
trademarks of SAS Institute Inc. in the USA and other countries. ® indicates USA registration.
Other brand and product names are trademarks of their respective companies.
SAS software may be provided with certain third-party software, including but not limited
to open-source software, which is licensed under its applicable third-party software license
agreement. For license information about third-party software distributed with SAS
software, refer to http://support.sas.com/thirdpartylicenses.
技术许可声明
• Scintilla - Copyright © 1998-2014 by Neil Hodgson <[email protected]>.
All Rights Reserved.
Permission to use, copy, modify, and distribute this software and its documentation for
any purpose and without fee is hereby granted, provided that the above copyright
notice appear in all copies and that both that copyright notice and this permission
notice appear in supporting documentation.
NEIL HODGSON DISCLAIMS ALL WARRANTIES WITH REGARD TO THIS SOFTWARE, INCLUDING
ALL IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS, IN NO EVENT SHALL NEIL
HODGSON BE LIABLE FOR ANY SPECIAL, INDIRECT OR CONSEQUENTIAL DAMAGES OR ANY
DAMAGES WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF OR IN
CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
• bzip2, the associated library “libbzip2“, and all documentation, are Copyright ©
1996-2010, Julian R Seward. All rights reserved.
Redistribution and use in source and binary forms, with or without modification, are
permitted provided that the following conditions are met:
Redistributions of source code must retain the above copyright notice, this list of
conditions and the following disclaimer.
The origin of this software must not be misrepresented; you must not claim that you
wrote the original software. If you use this software in a product, an acknowledgment
in the product documentation would be appreciated but is not required.
Altered source versions must be plainly marked as such, and must not be
misrepresented as being the original software.
The name of the author may not be used to endorse or promote products derived from
this software without specific prior written permission.
THIS SOFTWARE IS PROVIDED BY THE AUTHOR “AS IS“ AND ANY EXPRESS OR IMPLIED
WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF
MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO
EVENT SHALL THE AUTHOR BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR
BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER
IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING
IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
SUCH DAMAGE.
• libxml2 - Except where otherwise noted in the source code (e.g. the files hash.c, list.c
and the trio files, which are covered by a similar licence but with different Copyright
notices) all the files are:
Copyright © 1998 - 2003 Daniel Veillard. All Rights Reserved.
Permission is hereby granted, free of charge, to any person obtaining a copy of this
software and associated documentation files (the “Software“), to deal in the Software
without restriction, including without limitation the rights to use, copy, modify, merge,
publish, distribute, sublicense, and/or sell copies of the Software, and to permit persons
to whom the Software is furnished to do so, subject to the following conditions:
The above copyright notice and this permission notice shall be included in all copies or
substantial portions of the Software.
THE SOFTWARE IS PROVIDED “AS IS“, WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, FITNESS
FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL DANIEL
VEILLARD BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN
ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION
WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.
Except as contained in this notice, the name of Daniel Veillard shall not be used in
advertising or otherwise to promote the sale, use or other dealings in this Software
without prior written authorization from him.
• Regarding the decompression algorithm used for UNIX files:
Copyright © 1985, 1986, 1992, 1993
The Regents of the University of California. All rights reserved.
THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS “AS IS“ AND ANY
EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED
WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
DISCLAIMED. IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE FOR ANY
DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
(INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS
OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE,
EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
1. Redistributions of source code must retain the above copyright notice, this list of
conditions and the following disclaimer.
2. Redistributions in binary form must reproduce the above copyright notice, this list of
conditions and the following disclaimer in the documentation and/or other materials
provided with the distribution.
3. Neither the name of the University nor the names of its contributors may be used to
endorse or promote products derived from this software without specific prior written
permission.
• Snowball - Copyright © 2001, Dr Martin Porter, Copyright © 2002, Richard Boulton.
All rights reserved.
Redistribution and use in source and binary forms, with or without modification, are
permitted provided that the following conditions are met:
1. Redistributions of source code must retain the above copyright notice, this list of
conditions and the following disclaimer.
2. Redistributions in binary form must reproduce the above copyright notice, this list of
conditions and the following disclaimer in the documentation and / or other materials
provided with the distribution.
3. Neither the name of the copyright holder nor the names of its contributors may be
used to endorse or promote products derived from this software without specific prior
written permission.
THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND
CONTRIBUTORS \"AS IS\" AND ANY EXPRESS OR IMPLIED WARRANTIES,
INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF
MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
DISCLAIMED.IN NO EVENT SHALL THE COPYRIGHT HOLDER OR
CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES(INCLUDING, BUT NOT
LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED
AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
LIABILITY, OR TORT(INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN
ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
POSSIBILITY OF SUCH DAMAGE.
充分利用 JMP®
无论您是新手还是经验丰富的用户,都有需要了解的 JMP 知识。
访问 JMP.com 获取以下资源:
• JMP 入门知识网络讲座直播和录像
• 新功能和高级技巧视频演示和网络讲座
• 关于注册参加 JMP 培训的详细信息
• 您所在地区举办的研讨会安排
• 其他人使用 JMP 的成功案例
• JMP 员工分享使用技巧和使用经历的博客
• 同其他用户讨论 JMP 的论坛
http://www.jmp.com/getstarted/
目录
消费者研究
1 了解 JMP
文档和其他资源 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
格式规范 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
JMP 文档 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
JMP 文档库 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
JMP 帮助 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
学习 JMP 的其他资源 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
教程 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
样本数据表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
学习统计和 JSL 术语 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
学习 JMP 技巧 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
工具提示 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
JMP 用户社区 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
JMPer Cable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
用户编写的 JMP 手册 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
“JMP 起始页”窗口 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
技术支持 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2 消费者研究介绍
客户和行为研究方法概述 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3 分类响应分析
分析调查数据和其他计数数据 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
“分类”平台示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
启动 “分类”平台 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
响应角色 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
列角色 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
其他启动窗口选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
“分类”报表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
10 消费者研究
“分类”平台选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
报表选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
统计检验选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
其他 “分类”平台选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
响应表选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
比较字母 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
超类别 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
超类别选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
设置首选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
“分类”平台的更多示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
响应齐性检验的示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
多重响应检验的示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
单元格卡方检验的示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
使用比较字母 “比较每个样本”的示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
使用比较字母 “比较每个单元格”的示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
使用比较字母的用户指定比较的示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
条件关联和相对风险的示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
评级员一致性的示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
重复测量的示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
“多重响应”选项卡的示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
带比较字母的得分均值的示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
结构化报表的示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
“分类”平台的统计详细信息 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Rao-Scott 校正 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4 多重对应分析
标识分类变量各水平之间的关联 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
多重对应分析的示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
启动 “多重对应分析”平台 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
“多重对应分析”报表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
“多重对应分析”平台选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
对应分析选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
显示图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
显示详细信息 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
消费者研究 11
显示调整惯量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
显示坐标 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
显示汇总统计量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
显示对惯量的部分贡献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
显示平方余弦 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
交叉表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
补充行的交叉表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
补充列的交叉表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
“多重对应分析”平台的更多示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
使用补充变量的示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
使用补充 ID 的示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
“多重对应分析”平台的统计详细信息 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
“详细信息”报表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
调整惯量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
汇总统计量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
对惯量的部分贡献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
5 多维尺度化
直观表示一组对象间的邻近性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
“多维尺度化”平台概述 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
多维尺度化示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
启动 “多维尺度化”平台 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
“多维尺度化”报表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
多维尺度化图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
Shepard 图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
拟合详细信息 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
“多维尺度化”平台选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
Waern 链接 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
“多维尺度化”平台的更多示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
“多维尺度化”平台的统计详细信息 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
应力 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
变换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
特性列表格式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
12 消费者研究
6 因子分析
标识变量内的因子 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
“因子分析”平台概述 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
“因子分析”平台的示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
启动 “因子分析”平台 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
“因子分析”报表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
模型启动 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
旋转方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
“因子分析”平台选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
因子分析模型拟合选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
7 选择模型
针对选择实验拟合模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
“选择建模”平台概述 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
“选择”平台的示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
“无选择”的单表格式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
多表格式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
启动 “选择”平台 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
针对 “一个表,堆叠”的启动窗口 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
针对 “多个表,交叉引用”的启动窗口 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
“选择模型”报表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
效应汇总 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
参数估计值 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
似然比检验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
Bayes 参数估计值 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
“选择”平台选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
支付意愿 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
其他示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
示例:做出设计决策 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
细分示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
使用 “选择”平台进行 Logistic 回归的示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
配对的案例对照研究的 Logistic 回归示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
将数据转换为两个分析表的示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
将数据转换为一个分析表的示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
消费者研究 13
技术细节 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
特殊数据表规则 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
效用和概率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
梯度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
8 MaxDiff
针对 MaxDiff 实验拟合模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
“MaxDiff 建模”平台概述 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
MaxDiff 平台的示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
单表格式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
多表格式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
启动 MaxDiff 平台 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
针对 “一个表,堆叠”的启动窗口 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
针对 “多个表,交叉引用”的启动窗口 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
“MaxDiff 模型”报表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
效应汇总 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
MaxDiff 结果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
参数估计值 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
Bayes 参数估计值 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
似然比检验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
MaxDiff 平台选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
“比较”报表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
保存 Bayes 链 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
9 提升模型
对市场活动对消费者行为带来的增量影响进行建模 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
“提升”平台概述 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
“提升”平台的示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
启动 “提升”平台 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
“提升模型”报表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
提升模型图形 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
“提升”报表选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
10 项目分析
按项目和对象分析测试结果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
项目分析的示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
14 消费者研究
启动 “项目分析”平台 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
“项目分析”报表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
特征曲线 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
信息图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
对偶图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
参数估计值 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
“项目分析”平台选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
项目响应曲线 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
项目响应曲线模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
IRT 模型假设 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
拟合 IRT 模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
能力公式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
A 参考文献
索引
消费者研究 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
第1章
了解 JMP
文档和其他资源
本章包括以下信息:
• 手册规范
• JMP 文档
• JMP 帮助
• 其他资源,例如:
‒ 其他 JMP 文档
‒ 教程
‒ 索引
‒ Web 资源
‒ 技术支持选项
16 了解 JMP 第1章
格式规范 消费者研究
格式规范
以下规范有助于将书面材料与您在屏幕上看到的信息相联系:
• 样本数据表名称、列名、路径名称、文件名、文件扩展名和文件夹采用 Helvetica 字体显示。
• 代码以 Lucida Sans Typewriter 字体显示。
• 代码输出以 Lucida Sans Typewriter 斜体字体显示,并且相对于之前的代码缩进显示。
• Helvetica 粗体格式表示为了完成某个任务而选择的项:
‒ 按钮
‒ 复选框
‒ 命令
‒ 可供选择的列表名称
‒ 菜单
‒ 选项
‒ 选项卡名称
‒ 文本框
• 下列项采用楷体字体显示:
‒ 重要的或具有特定 JMP 定义的字词
‒ 手册标题
• 下列项采用斜体显示:
‒ 变量
‒ 脚本输出
• 仅适用于 JMP Pro 的功能使用 JMP Pro 图标 加以注释。对于 JMP Pro 功能概述,请访
问 http://www.jmp.com/software/pro/。
注意:特殊信息和适用的局限性将在 “注意”中显示。
提示:实用信息将在 “提示”中显示。
JMP 文档
JMP 提供各种格式的文档,包括印刷手册、可移植文档格式 (PDF) 以及电子书 (e-books)。
• 可以从帮助 > 手册菜单打开 PDF 版本。
第1章 了解 JMP 17
消费者研究 JMP 文档
JMP 文档库
JMP 帮助
学习 JMP 的其他资源
除了 JMP 文档和 “JMP 帮助”外,还可以使用以下资源学习 JMP:
• 教程 (请参见第 22 页的 “教程”)
• 样本数据 (请参见第 22 页的 “样本数据表”)
• 索引 (请参见第 23 页的 “学习统计和 JSL 术语”)
• 今日提示 (请参见第 23 页的 “学习 JMP 技巧”)
• Web 资源 (请参见第 24 页的 “JMP 用户社区”)
• JMPer Cable 技术出版物 (请参见第 24 页的 “JMPer Cable”)
• 有关 JMP 的手册 (请参见第 24 页的 “用户编写的 JMP 手册”)
• JMP 起始页 (请参见第 24 页的 ““JMP 起始页”窗口”)
• 教学资源 (请参见第 22 页的 “样本数据表”)
教程
可以选择帮助 > 教程来访问 JMP 教程。教程菜单中的第一项是教程目录。这将打开一个新的窗
口,其中包含按类别分组的所有教程。
若您不熟悉 JMP,则从初学者教程开始。它分步介绍了 JMP 界面并解释了使用 JMP 的基本操作。
其余教程有助于您了解 JMP 的特定方面,例如设计实验以及将样本均值与常数比较。
样本数据表
JMP 文档系列中的所有示例使用的都是样本数据。选择帮助 > 样本数据库以打开样本数据目录。
要查看按字母顺序列出的样本数据表或查看不同分类下的样本数据,选择帮助 > 样本数据。
第1章 了解 JMP 23
消费者研究 学习 JMP 的其他资源
样本数据表安装在以下目录:
在 Windows 上:C:\Program Files\SAS\JMP\12\Samples\Data
在 Macintosh 上:\Library\Application Support\JMP\12\Samples\Data
在 JMP Pro 中,样本数据安装在 JMPPRO (而不是 JMP)目录中。在 JMP 的拆封许可版中,
样本数据安装在 JMPSW 目录中。
要查看使用样本数据的示例,选择帮助 > 样本数据并导航到 “教学资源”部分。要了解教学资
源的更多信息,请访问 http://jmp.com/tools。
学习统计和 JSL 术语
帮助菜单包含以下索引:
统计索引 提供统计术语定义。
脚本索引 使您可以搜索有关 JSL 函数、对象和显示框的信息。您还可以从 “脚本索引”编辑
和运行样本示例。
学习 JMP 技巧
工具提示
若您将光标放置在下列项之上, JMP 会提供说明性工具提示:
• 菜单或工具栏选项
• 图形中的标签
• 报表窗口中的文本结果 (在结果上以圆圈的方式移动光标可显示提示)
• “主窗口”中的文件或窗口
• “脚本编辑器”中的代码
JMP 用户社区
JMPer Cable
JMPer Cable 是面向 JMP 用户的年度技术出版物。您可以从以下 JMP 网站获取 JMPer Cable:
http://www.jmp.com/about/newsletters/jmpercable/
用户编写的 JMP 手册
“JMP 起始页”窗口
技术支持
JMP 技术支持由在 SAS 和 JMP 接受过培训的统计学家和工程师提供,其中很多人具有统计学
或其他技术学科的研究生学位。
许多技术支持选项在 http://www.jmp.com/support 中提供,包括技术支持电话。
第2章
消费者研究介绍
客户和行为研究方法概述
JMP 提供一整套工具来分析消费者和行为研究数据。您收集关于客户如何使用产品或服务、客
户对您提供的产品或服务是否满意,以及客户可能需要的新功能等方面的信息。对这些信息的
深入分析让您能够创造出更好的产品和服务、令客户更加满意,并给自己的组织带来更丰厚的
收入。用于分析这些消费者研究活动的工具位于 “消费者研究”菜单中。可使用以下平台分析
您的数据:
• “分类”平台支持您制表、绘图并比较数据中的分类响应,包括多重响应数据。您可以使用
该平台分析调查数据以及其他分类响应数据,如:缺陷记录和研究参与者的人口统计数据。
使用 “分类”平台,您可以分析以许多不同方式组织的数据中的响应。详细信息,请参见第
3 章,“分类响应分析”。
• “多重对应分析” (MCA) 平台适用于多个分类变量,并力求确定这些变量各水平之间的关
联。 MCA 常用在社会科学中,在法国和日本尤为普遍。可将其用在调查分析中,找出测试
对象对不同问题的态度一致性。详细信息,请参见第 4 章,“多重对应分析”。
• “多维尺度化 (MDS)”平台支持您创建一组对象中邻近关系 (相似性、相异性或距离)的模
式的直观表示。详细信息,请参见第 5 章,“多维尺度化”。
• “因子分析”平台支持您从更大的一组观测变量中构造因子。这些因子可以表示为观测变量
子集的线性组合。通过因子分析,您可以探索由一组测量的观测变量解释的因子数量,以及
因子与变量之间关系的强度。详细信息,请参见第 6 章,“因子分析”。
• 该“选择”平台专用于市场研究实验,其最终目标是发现消费者的偏好结构。然后我们根据
得到的消费者对不同特性的偏好结果来设计并提供他们喜欢的产品或服务。详细信息,请参
见第 7 章,“选择模型”。
• MaxDiff 平台可替代使用标准偏好尺度来确定评级项的相对重要性。MaxDiff 模型强制响应
者报告其最其最喜欢和最不喜欢的选项,从而强制响应者按偏好程度对选项排名。详细信
息,请参见第 8 章,“MaxDiff”。
• “提升”平台支持您通过将营销信息仅发送给可能积极响应的个人来最大化市场营销预算的
影响,即便是在您的数据集非常大而且有许多可能的行为或人口统计预测变量的情况下。您
可以使用提升模型进行此类预测。开发该方法是为了帮助优化市场营销决策、确定个性化的
药物方案,或是更加宽泛地来讲 — 确定很可能响应某种行为的个人的特征。详细信息,请
参见第 9 章,“提升模型”。
• “项目分析”平台支持您拟合项目响应原理模型。项目响应原理 (IRT) 方法用于对测量手段
(如:测试和问卷)进行分析和评分。 IRT 使用模型体系将个体的特征与该个体正面或正确
响应某个项目的概率相关联。IRT 可用于研究标准化测试、认知发展和消费者偏好。详细信
息,请参见第 10 章,“项目分析”。
26 消费者研究介绍 第2章
消费者研究
第 3章
分类响应分析
分析调查数据和其他计数数据
“分类”平台支持您对分类响应数据 (包括多重响应数据)进行制表、绘图以及比较。您可以
使用该平台分析调查数据以及其他分类响应数据,如:缺陷记录和研究参与者的人口统计数据。
利用 “分类”平台,您可以分析多种不同数据结构的响应数据。“分类”启动窗口支持您选择
您想要的数据分析以及相应的数据格式。
图 3.1 分类分析示例
28 分类响应分析 第3章
“分类”平台示例 消费者研究
“分类”平台示例
本例使用 Consumer Preferences.jmp 样本数据表,其中包含关于消费者态度和意见的调查数
据,以及关于口腔卫生的若干问题。您可以使用 “分类”平台比较不同年龄组的消费者在问题
上的响应差异。
1. 选择帮助 > 样本数据库,然后打开 Consumer Preferences.jmp。
2. 选择分析 > 消费者研究 > 分类。
3. 选择我在计划我的职业并点击 “简单”选项卡上的响应。
4. 选择年龄组并点击 X,分组类别。
5. 点击确定。
6. 点击 “分类”红色小三角并选择交叉表转置。
7. 点击 “分类”红色小三角并选择检验响应齐性。
图 3.2 不同年龄组对问题的响应
启动 “分类”平台
通过选择分析 > 消费者研究 > 分类来启动 “分类”平台。
图 3.3 “分类”平台启动窗口
响应角色
启动窗口包括用于三种特定的响应角色 (简单、相关和多重)类型 (或类别)的选项卡,以及
一个供您创建定制数据汇总的 “结构化”选项卡。响应角色对应于您要分析的响应类型。每个
选项卡上的选项对应于响应在数据表中的结构。
“简单”选项卡
“简单”选项卡适用于响应结果包含在一列的数据分析。
响应 向分析中添加一个或多个列。若选定多列,则分类报表包含针对每一单列的报表。
“相关”选项卡
“相关”选项卡包含用于一组相关列的分析的选项。
30 分类响应分析 第3章
启动 “分类”平台 消费者研究
对齐的响应 在单个报表中汇总响应水平相同的多重响应的数据。该选项适用于多个问题具有
相同响应水平的调查数据。您可以快速汇总和一起比较所有问题的响应趋势。
重复测量 汇总多个列中的数据,其中的每一列都包含在不同时点作出的响应。若某人在多个
时点都作出响应,则样本被称为重叠。若有重叠样本,则使用 Kish 校正。请参见 Kish
(1965, section 12.4)。
评级员一致性 汇总多个列中的数据,其中的每一列都是不同的个人 (评级员)对同一问题的
评级。
“多重”选项卡
“多重”选项卡包含用于在一个或多个列中记录的多重响应的分析的选项。一组多重响应可来自
这样的调查:其中的响应集允许多项选择 (“选中所有适用选项”问题)。多重响应的另一个来
源是缺陷数据,在此种场景下产品可能存在多个缺陷。“多重”选项卡上的选项分别对应于数据
表中不同的数据结构。
多重响应 汇总多个列的数据,其中的每列都包含一个响应。选定列的数目是单个行的响应的
最大数目。列中可包含许多空格。
由 ID 标识的多重响应 汇总单个响应列的数据,同时附带另一列,其中包含测试对象或部件的
ID。可将该数据结构视为堆叠格式。
分隔的多重响应 汇总单个列的数据,该列包含由逗号、分号或制表符分隔的多重响应。
指示符组 汇总存储在指示符列中的多重响应。在该数据表中,每个可能的响应都对应一列,每
一列都是一个指示符 (例如, 0 和 1)。
响应频数 汇总存储在带有频数统计的列中的多重响应。该数据格式是汇总的“指示符组”格式。
自由文本 汇总文本数据。“自由文本”选项可在“分类”报表窗口中启动“文本资源管理器”
报表。请参见 《基本分析》手册中的 “文本资源管理器”一章。
“结构化”选项卡
“结构化”选项卡支持您构造汇总统计量的定制表。
• 使用交互表生成器创建并排、交叉和嵌套数据汇总。结构化表将表的一侧上最里面的项视作
响应,将其他所有项都视作分组因子。
• 在单个启动窗口中创建多个表。
• 当列建模类型设置为 “多重响应”时,使用分隔的多重响应列。有关列建模类型的详细信
息,请参见 《使用 JMP》手册中的 “列信息”窗口。
请参见第 58 页的 “结构化报表的示例”。
提示:使用 “结构化”选项卡检验多重响应数据的响应齐性。
第3章 分类响应分析 31
消费者研究 启动 “分类”平台
列角色
以下角色可用:
X,分组类别 将某列指定为分组类别。为每组都汇总响应。若使用不止一个分组列,则默认情
况下,表将被嵌套 (“组合分组”选项)。使用 “分组”选项可更改该汇总模式。
样本大小 针对具有汇总数据的多个响应角色,分配一列以定义频数所适用的组中各个单元的
数目。例如,“频数”列可能指示 50 个缺陷,而样本大小变量将反映出这些缺陷来自 100
个单元。
频数 指定一个频数变量。该选项适用于汇总数据,
ID 分配用于标识响应者的列。仅当选定“由 ID 标识的多重响应”时才需要使用该选项;当选
择其他响应角色时并不会使用该选项。
依据 为 “依据”变量的每个水平生成单独报表。若分配了多个 “依据”变量,则为 “依据”
变量水平的每个可能组合生成单独报表。
其他启动窗口选项
更多选项位于启动窗口的左下角。或者,在启动窗口中点击 “确定”后,也可以从 “分类”红
色小三角菜单中选择这些选项。
分组选项 指定了多个分组列时,定义如何在分析中使用分组变量。
组合 分析分组变量组合的响应。分组列表中的第一列是最外层的组。
单独 单独分析每个分组变量的响应。
二者 为分组变量的组合以及逐一为每个分组变量提供报表。
在 ID 中仅出现一次 统计某个测试对象的非重复响应水平数。必须指定 ID 变量。
将缺失响应计算在内 在交叉表和图中包含缺失值,作为类别。在统计比较中排除这些缺失值。
缺失值可为空单元格,或是在 “缺失值代码”列属性中定义的缺失代码。若某列仅包含缺
失值,无论是否选择该选项,都会统计缺失值。
将响应水平从高到低排序 从高到低对响应排序。(默认排序为从低到高。)该选项仅适用于响
应,不适用于分组类别。
缩短标签 通过删除所有标签共有的前缀和后缀来缩短值标签。
注意:该选项仅适用于值标签,而不适用于列名。
“分类”报表
初始“分类”报表为每组选定的响应显示一个交叉表和一个份额图。若使用“结构化”选项卡,
初始报表仅显示一个交叉表。
图 3.4 初始分类报表
“分类”平台选项
“分类”红色小三角菜单包含支持您可根据自己的需要定制报表的选项。特定报表中的选项由响
应角色、是否使用分组类别以及在启动窗口中选定的选项来确定。
报表选项
频数 在交叉表中显示或隐藏频数。频数是每个类别中的响应计数。
响应的份额 (份额) 在交叉表中显示或隐藏响应的份额。响应的份额是响应在每个类别中的
百分比。
每种情况的比率 (比率) (仅适用于多重响应。)在交叉表中显示或隐藏每种情况的比率。每
种情况的比率是基于情况总数 (无论是否为响应者)的每个类别中的响应的百分比。
每种情况的响应率 (仅适用于多重响应。)在交叉表中显示或隐藏每种情况的响应率。每种情
况的响应率是基于响应情况数的每个类别中的响应百分比。
份额图 显示或隐藏一个分割条形图。直条长度与每种类型的响应百分比成正比。右侧的列显
示每个分组类别中的响应数。若未使用分组类别,则右侧列显示响应总数。
提示:您可以使用“值颜色”列属性更改份额图中的颜色。请参见《使用 JMP》中的“‘列
信息’窗口”一章。
频数图 显示或隐藏频数图。其中的直条反映每组内的响应频数。整个图中的刻度都是一致的。
最右侧的灰条是每个分组类别中的响应总数。
提示:您可以使用“值颜色”列属性更改频数图中的颜色。请参见《使用 JMP》中的“‘列
信息’窗口”一章。
转置的频数图 显示或隐藏转置的频数图。其中的直条反映每组内的响应频数。响应对应行,分
组水平对应图中的列。每个分组水平的合计通过图底部行中的灰条来表示。
34 分类响应分析 第3章
“分类”平台选项 消费者研究
统计检验选项
可用的统计检验选项取决于响应角色以及是否在分析中使用分组变量。选项包括响应齐性、关
联、相对风险和一致性等方面的检验。
检验多重响应 (仅适用于具有一个或多个分组类别的多重响应数据。)请参见第 42 页的 “多
重响应检验的示例”。包含以下跨各个分组类别的响应的独立性检验:
显示或隐藏使用 Poisson 回归的比率独立性检验。每单位频数通过样本
计数检验, Poisson
分类变量来建模。结果是一个似然比卡方检验,检验每个单独响应的比率在各分组水平
之间是否不同。
齐性检验,二项 显示或隐藏每个单独的响应水平的似然比卡方独立性检验。每个响应类别
都服从二项分布 (选定或未选定)。
检验响应齐性 (可用于具有一个或多个分组类别的单个响应变量 (简单或对齐) 。可用于在
“结构化”选项卡内具有一个或多个分组的多重响应。)显示或隐藏包含依赖于您的方法的
响应齐性检验的报表:
‒ 对于分组类别之间的响应独立性,提供似然比和 Pearson 卡方检验。请参见第 41 页的
“响应齐性检验的示例”。
‒ 对于 “结构化”选项卡中的多重响应分析,提供 Rao-Scott 卡方检验。
单元格卡方 为卡方独立性检验显示或隐藏表中每个单元格的 p 值。较小的 p 值指示单元格中
的观测值大于或小于期望值 (假设前提是:行独立于列) 。根据该计数是大于还是小于期
望值对 p 值着色。请参见第 44 页的 “单元格卡方检验的示例”。
比较每个样本 (仅适用于具有一个或多个分组变量的单个响应。)显示或隐藏不同水平组之间
响应的独立性检验报表 , 其中包括配对似然比和 Pearson 卡方。请参见第 45 页的 “使用比
较字母 “比较每个样本”的示例”。
比较每个单元格 (仅适用于具有一个或多个分组变量的单个和多重响应。 ) 针对响应的每个
水平与分组变量各水平组合而成的其他所有水平之间的独立性对比,显示或隐藏配对似然
比卡方。若某个响应仅有两个水平,则还会提供 Pearson 卡方和 Fisher 精确检验。请参见
第 46 页的 “使用比较字母 “比较每个单元格”的示例”。
相对风险 (在分组变量有两个水平、响应有两个水平或为多重响应,并且已选定 “在 ID 中仅
出现一次”选项的情况下,该选项才可用。)针对响应的每个水平,显示或隐藏二水平分组
变量的相对风险。请参见第 49 页的 “条件关联和相对风险的示例”。
第3章 分类响应分析 35
消费者研究 “分类”平台选项
其他 “分类”平台选项
总响应数 显示或隐藏交叉表和份额图中的响应的频数统计总和。使用分组变量时,合计涵盖
每个分组类别。
响应水平 显示或隐藏交叉表和份额图中的响应列的类别。
显示超类别 (仅当定义一个或多个超类别时可用。)显示或隐藏交叉表和份额图中的超类别对
应的列。有关超类别的详细信息,请参见第 39 页的 “超类别”。
提示:该选项显示或隐藏超类别。要隐藏超类别中的单个类别,请使用 “超类别”列属性中
的 “隐藏”选项。或者,使用 “响应水平”选项隐藏所有响应水平,以便只有超类别保持
可见。
总案例数 (仅适用于多重响应列。)显示或隐藏交叉表中包含每组中的案例(测试对象)数的列。
响应的总案例数 (仅适用于多重响应列。 )显示或隐藏交叉表中包含至少响应一次的案例 (测
试对象)数的列。没有做出任何响应的人员不包括在内。响应的总案例数小于等于总案例数。
得分均值 显示或隐藏交叉表和份额图中包含响应总均值或每个分组类别的均值的列。基于为
每个响应类别分配的数值计算该均值。
‒ 对于数值类别,数值是实际值。
‒ 对于非数值类别,该值是通过 “值得分”列属性分配给类别的值。
‒ 对于没有值得分的类别,该值基于为类别数分配的默认值 1。
请参见第 57 页的 “带比较字母的得分均值的示例”。
得分均值比较 在交叉表中显示或隐藏 “比较均值”列。该列使用非合并的 Satterthwaite t 检
验进行配对比较,来比较各个分组类别的得分均值。请参见 SAS Institute (2009)。使用字
36 分类响应分析 第3章
“分类”平台选项 消费者研究
母显示比较结果。有关比较字母的详细信息,请参见第 38 页的 “比较字母”。有关指定比
较组的详细信息,请参见第 48 页的 “使用比较字母的用户指定比较的示例”。
得分标准差 显示或隐藏交叉表和份额图中包含响应总标准差或每个分组类别的标准差的列。
按得分均值排序 (仅当有多个响应且分析中没有分组变量时才显示。)按得分均值对响应报表
排序。
保存表 将报表特定部分保存到新数据表中。每个选项都为每个报表创建单独的数据表。该菜
单中可用的选项取决于选定的分析。
注意:超类别不包含在新表中。
保存频数 将交叉表中的频数统计保存到新数据表中。
保存响应的份额 将交叉表中的响应份额保存到新数据表中。
保存每种情况的比率 将交叉表中的每种情况的比率保存到新数据表中。
保存转置频数 将交叉表中的转置频数统计保存到新数据表中。
保存转置的响应份额 将交叉表中的转置的响应份额保存到新数据表中。
保存转置的每种情况的比率 将交叉表中转置的每种情况的比率保存到新数据表中。
保存检验比率 将 “检验多重响应”选项的结果保存到新数据表中。
保存齐性检验结果 将 “检验响应齐性”选项的结果保存到新数据表中。
保存得分均值 将每个样本组的得分均值保存到新数据表中。
保存 t 检验和 p 值 将 “得分均值比较”报表中的 t 检验和 p 值保存到新数据表中。
响应表选项
显示字母 在交叉表中显示或隐藏列字母 ID。这些字母用在许多齐性检验中,当执行这些检验
时,字母会自动显示。
指定比较组 支持您为齐性检验指定特定比较组。使用用斜线分隔的组比较字母表示每个组。
用逗号分隔多个组。例如,要检验 A 与 E, B 与 D, C 与 F,应按照 “A/E, B/D, C/F”来
指定各组。为定义的比较组提供 “比较每个单元格”报表。请参见第 48 页的 “使用比较
字母的用户指定比较的示例”。
删除 从报表窗口中删除报表。
警告:无法撤销 “删除”选项。
38 分类响应分析 第3章
比较字母 消费者研究
比较字母
“比较每个单元格”、“比较每个样本”和 “得分均值比较”命令都使用字母来标识样本水平。
若超过 26 个水平,则会在字母之后追加数字。若启用某个比较选项,这些字母将显示在交叉表
的样本水平标题中。
图 3.5 带比较字母的交叉表
若两个样本水平存在显著差异,响应份额较小的样本水平的字母会被添加到另一个水平的比较
单元格中。与小写字母相比,大写字母指示水平间存在更大的差异。大写字母的默认 alpha 水
平 (显著性水平)为 0.05,小写字母的默认 alpha 水平为 0.10。在图 3.5 中, B 指示在 0.05 这
个显著性水平下,Sporty(运动型)和 Family(家用型)轿车的原产国有差异。B 位于 Family
轿车这一行中,这是因为 Family 轿车的总响应数 (155) 大于 Sporty 轿车的总响应数 (100)。c 位
于 Sporty 行中,这指示在比较 Sporty 和 Work (工作用车)轿车时,在 0.10 水平下两种车型
的原产国之间有差异。c 位于 Sporty 行中,这是因为其总响应数 (100) 大于 Work 轿车的总响应
数 (48)。
计数较小警告也包含在比较单元格中。一个星号指示水平的响应数小于 100,两个星号指示水平
的响应数小于 30。在图 3.5 中,请注意 Work 对应的行总共有 48 个响应,并且标有一个星号。
您可以在 “分类”平台首选项中更改 alpha 水平和警告计数。有关更改首选项的详细信息,请
参见第 40 页的 “设置首选项”。
请参见第 45 页的 “使用比较字母 “比较每个样本”的示例”、第 46 页的 “使用比较字母 “比
较每个单元格”的示例”和第 57 页的 “带比较字母的得分均值的示例”。
第3章 分类响应分析 39
消费者研究 超类别
超类别
超类别一词是指响应类别的聚合。例如,使用五分评级制时,您可能想要了解前两个评级中的
响应百分比 (前两个框)。可使用 “超类别”列属性定义这样的响应分组。
可通过超类别向交叉表和频数图添加更多列。份额图不显示超类别,超类别不应用于分组列。
要创建超类别,请执行以下步骤:
1. 在数据表中选择您要聚合的类别所在的列。
2. 选择列 > 列信息。
3. 点击列属性,然后选择超类别。
4. (可选)要更改超类别的默认名称,请输入 “超类别名称”。
5. 从 “列的类别”列表中选择一个或多个类别。
6. 点击添加。
7. (可选)选择所需超类别,然后点击 “超类别”红色小三角菜单查看更多选项。
超类别选项
“列属性”窗口的 “超类别”红色小三角菜单中提供以下选项:
隐藏 隐藏交叉表和频数图中超类别中的类别。
提示:若想要灵活地显示或隐藏报表中的单个类别,则不要使用 “隐藏”选项;改为使用
“分类”红色小三角菜单中的 “响应水平”选项。
净值 (仅适用于多重响应列。)当各个响应者出现在多个超类别中时,防止对其重复计数。
添加均值 在报表中包含均值统计量。
添加标准差 在报表中包含标准差统计量。
全部添加 在报表中包含总响应数。默认情况下,始终包含 “总响应数”列。
设置首选项
“分类”红色小三角菜单提供 “设置首选项”选项,该选项支持您指定设置和首选项。
图 3.6 “设置首选项”窗口
为您要设置的选项选择设置框。若想要默认显示该选项,请选中该选项框;若不想默认显示该
选项,请取消选中该选项框。要提交您对平台首选项的更改,请选中提交平台首选项框。要将
您所做的更改另存为首选项脚本,请选中创建平台首选项脚本框。启动 “分类”平台时,将使
用与当前首选项集关联的首选项创建 “分类”报表。
注意:运行该脚本可将这些首选项提交给平台首选项。您可以使用平台首选项脚本在多个用户
之间共享首选项集,或保存这些设置以便用于特定项目。
第3章 分类响应分析 41
消费者研究 “分类”平台的更多示例
“分类”平台的更多示例
本节包括下列示例:
• 第 41 页的 “响应齐性检验的示例”
• 第 42 页的 “多重响应检验的示例”
• 第 44 页的 “单元格卡方检验的示例”
• 第 45 页的 “使用比较字母 “比较每个样本”的示例”
• 第 46 页的 “使用比较字母 “比较每个单元格”的示例”
• 第 48 页的 “使用比较字母的用户指定比较的示例”
• 第 49 页的 “条件关联和相对风险的示例”
• 第 51 页的 “评级员一致性的示例”
• 第 52 页的 “重复测量的示例”
• 第 53 页的 ““多重响应”选项卡的示例”
• 第 57 页的 “带比较字母的得分均值的示例”
• 第 58 页的 “结构化报表的示例”
响应齐性检验的示例
本例使用 Car Poll.jmp 样本数据表,其中包含汽车的相关调查数据。数据中包括有关调查的个
人的人口统计信息以及他们所拥有的轿车的信息。您想要了解婚姻状况与轿车原产地之间的关
系。还想要检验响应齐性。也就是说,您想要通过检验来判定对于已婚和单身的两类响应群体,
轿车原产地的分布是否相同。
该检验有两个版本, Pearson 和似然比检验,这两个检验都提供卡方统计量和 p 值。
1. 选择帮助 > 样本数据库,然后打开 Car Poll.jmp。
2. 选择分析 > 消费者研究 > 分类。
3. 选择国家并点击 “简单”选项卡上的响应。
4. 选择婚姻状况并点击 X,分组类别。
5. 点击确定。
6. 点击 “分类”红色小三角并选择检验响应齐性。
42 分类响应分析 第3章
“分类”平台的更多示例 消费者研究
图 3.7 检验响应齐性
份额图指示已婚组所拥有的轿车在美国车和日本车之间均匀拆分。在单身组中,日本车是最常
拥有的车型。响应齐性检验的显著性大约为 0.08。因此,当 alpha 水平为 0.05 时,不同婚姻状
况人群的响应概率并不存在统计上的显著性差异。
多重响应检验的示例
本例使用 Consumer Preferences.jmp 样本数据表,其中包含关于消费者态度和意见的调查数据,
以及关于口腔卫生的若干问题。您可以使用 “检验多重响应”选项检验每个刷牙时间 (刷牙分
隔)的响应率在各组 (刷牙)之间是否相同。其中,各组是按照响应者刷牙的频数来定义的。
1. 选择帮助 > 样本数据库,然后打开 Consumer Preferences.jmp。
2. 选择分析 > 消费者研究 > 分类。
3. 选择刷牙分隔并点击 “多重”选项卡上的分隔的多重响应。
4. 选择刷牙并点击 X,分组类别。
5. 点击确定。
6. 点击 “分类”红色小三角,然后选择检验多重响应 > 计数检验 , Poisson。
第3章 分类响应分析 43
消费者研究 “分类”平台的更多示例
p 值显示饭后、睡前和其他的响应率在各个刷牙组之间显著不同。起床后的响应率在各个刷牙
组之间没有显著不同。从交叉表中,您可以看到多数人都在起床后刷牙,不论他们刷几次。
7. 点击 “分类”红色小三角菜单并选择检验多重响应 > 齐性检验,二项。
图 3.9 检验多重响应,二项
单元格卡方检验的示例
本例使用 Consumer Preferences.jmp 样本数据表,其中包含关于消费者态度和意见的调查数
据,以及关于口腔卫生的若干问题。您要探索各年龄组之间对于 “我在计划我的职业”这一陈
述的响应的分布。
1. 选择帮助 > 样本数据库,然后打开 Consumer Preferences.jmp。
2. 选择分析 > 消费者研究 > 分类。
3. 选择我在计划我的职业并点击 “简单”选项卡上的响应。
4. 选择年龄组并点击 X,分组类别。
5. 点击确定。
6. 点击 “分类”红色小三角并选择交叉表转置。
7. 点击 “分类”红色小三角并选择单元格卡方。
图 3.10 单元格卡方
使用比较字母 “比较每个样本”的示例
本例使用 Consumer Preferences.jmp 样本数据表,其中包含关于消费者态度和意见的调查数
据,以及关于口腔卫生的若干问题。您要探索各年龄组之间对于 “我在计划我的职业”这一陈
述的响应的分布。
1. 选择帮助 > 样本数据库,然后打开 Consumer Preferences.jmp。
2. 选择分析 > 消费者研究 > 分类。
3. 选择我在计划我的职业并点击 “简单”选项卡上的响应。
4. 选择年龄组并点击 X,分组类别。
5. 点击确定。
6. 点击 “分类”红色小三角并选择比较每个样本。
图 3.11 比较每个样本
交叉表汇总了各年龄组之间关于 “我在计划我的职业”的这一陈述。该表的单元格包含各个年
龄组中同意或不同意这一陈述的响应者频数 (计数)和份额 (百分比)。此外,交叉表还包括
比较字母。每个组都标有一个字母,该字母位于组标签右侧的列中。比较列使用这些字母来解
释各组间独立性统计检验的结果。
“比较每个样本”分级显示项提供来自配对 Pearson 和卡方似然比卡方检验的 p 值。该 p 值在比
较字母标记的对称矩阵中报告。
对于本例,我们进行了以下观测:
46 分类响应分析 第3章
“分类”平台的更多示例 消费者研究
• 25 - 29 年龄组的比较列包含 b - g 之间的所有字母。因此,与其他所有组相比, 25 - 29 年龄
组对于 “我在计划我的职业”这一陈述的响应率有显著不同。由于字母 b 小写, 25 - 29 年
龄组与 30 - 34 年龄组之间的差异在 0.10 水平下显著。所有其他字母都是大写字母,表明在
0.05 水平下差异显著。
• >54 的年龄组 (用字母 G 表示)与 30 - 34 年龄组 (用 B 表示)显著不同。比较字母位于组
G 的单元格中,因为组 G 的响应者份额比组 B 高 (71 对 68)。
• 比较单元格中的单个星号是小样本警告。单个星号表明组中有 30 个以上 100 个以下的响应。
• 两个星号 (本例未观测到)则表明组大小小于 30。
使用比较字母 “比较每个单元格”的示例
本例使用 Consumer Preferences.jmp 样本数据表,其中包含关于消费者态度和意见的调查数
据,以及关于口腔卫生的若干问题。您要探索员工任职组之间对于 “我在计划我的职业”这一
陈述的响应的分布。
1. 选择帮助 > 样本数据库,然后打开 Consumer Preferences.jmp。
2. 选择分析 > 消费者研究 > 分类。
3. 选择工作满意度,并在 “简单”选项卡上点击响应。
4. 选择员工任职并点击 X,分组类别。
5. 点击确定。
6. 点击 “分类”红色小三角菜单并选择比较每个单元格。
第3章 分类响应分析 47
消费者研究 “分类”平台的更多示例
图 3.12 比较每个单元格
使用比较字母的用户指定比较的示例
本例使用 Consumer Preferences.jmp 样本数据表,其中包含关于消费者态度和意见的调查数
据,以及关于口腔卫生的若干问题。您需要定义特定的比较组,在这些组之间比较对于 “我在
计划我的职业”这一陈述的响应。
1. 选择帮助 > 样本数据库,然后打开 Consumer Preferences.jmp。
2. 选择分析 > 消费者研究 > 分类。
3. 选择工作满意度,并在 “简单”选项卡上点击响应。
4. 选择员工任职并点击 X,分组类别。
5. 点击确定。
6. 点击 “响应”红色小三角菜单并选择显示字母。
7. 点击 “响应”红色小三角菜单并选择指定比较组。
8. 输入 A/B、 B/C、 C/D。
9. 点击 “分类”红色小三角菜单并选择检验响应齐性。
图 3.13 指定比较示例
第3章 分类响应分析 49
消费者研究 “分类”平台的更多示例
条件关联和相对风险的示例
本例使用 AdverseR.jmp 样本数据表,其中包含来自临床试验的不良反应。使用该数据可探索不
良事件的条件关联,之后探索与控制组比照后的治疗组中事件的相对风险。
1. 选择帮助 > 样本数据库,然后打开 AdverseR.jmp。
2. 选择分析 > 消费者研究 > 分类。
3. 选择不良反应,并在 “多重”选项卡上点击由 ID 标识的多重响应。
4. 选择治疗组并点击 X,分组类别。
5. 选择患者 ID,然后点击 ID。
6. 选择在 ID 中仅出现一次并点击确定。
7. 点击 “分类”红色小三角菜单并选择条件关联。
50 分类响应分析 第3章
“分类”平台的更多示例 消费者研究
条件关联矩阵提供在有某一不良反应的前提下,存在另一不良反应的条件概率。概率涉及所
有组。在患者有异常疼痛的前提下,视觉异常的概率为 0.0323。
提示:将鼠标置于热图之上可得到条件概率。
8. 点击 “分类”红色小三角菜单并选择相关风险。
9. 在窗口中选择 PBO 并点击确定。
10. 右击窗口中的 “相对风险”报表并选择按列排序。
11. 选择相对风险并点击确定。
第3章 分类响应分析 51
消费者研究 “分类”平台的更多示例
“相对风险”选项通过计算分组变量不同水平的风险比率来得到不同响应值的相对风险。默认相
对风险报表列出响应名称、分组变量每个水平的风险 (比率)、具有 95% 置信区间的相对风险
图,以及相对风险估计值。在此您可以按治疗组比较不良反应的相对风险。 PBO 组感染的相对
风险是 ST_DRUG 组的 5.7 倍。不过,置信区间非常宽,并且包括相对风险 1.0。当分组变量每
个水平的风险相同时就会出现相对风险 1.0。
右击并选择列 > 95% 下限和列 > 95% 上限,将相对风险估计值的 95% 置信区间添加至报表表。
评级员一致性的示例
本例使用 Attribute Gauge.jmp 样本数据,其中包含三个操作员对 50 个部件评级 3 次的评级数
据 (0/1)。
1. 选择帮助 > 样本数据库,然后打开 Attribute Gauge.jmp。
2. 选择分析 > 消费者研究 > 分类。
3. 选择 A、 B 和 C。
4. 在 “相关”选项卡上,点击评级员一致性。
52 分类响应分析 第3章
“分类”平台的更多示例 消费者研究
5. 点击确定。
图 3.16 “评级员一致性”报表
重复测量的示例
本例使用 Presidential Elections.jmp 样本数据表,其中包含 1980 到 2012 年间美国各州的总统
选举结果。使用该数据探索重复测量,在此我们将选举结果视为重复测量。
1. 选择帮助 > 样本数据库,然后打开 Presidential Elections.jmp。
2. 选择分析 > 消费者研究 > 分类。
3. 选择 1980 年获胜党到 2012 年获胜党。
4. 在 “相关”选项卡上,点击重复测量。
5. 点击确定。
6. 靠近报表窗口的底部,点击灰色 “转换报表”展开图标打开 “转换报表”。
第3章 分类响应分析 53
消费者研究 “分类”平台的更多示例
图 3.17 重复测量转换报表
“多重响应”选项卡的示例
以下示例使用的样本数据表包含相同的信息,但这些数据表的布局不同。数据来自对两种不同条
件下的三个不同场合的生产线的检验。每组生产条件(批次)都生成 50 个待检单元。检验员记录
了七种缺陷。每个单元可能有 0、 1 或不止一个缺陷。一个单元可能有多个同一类型的缺陷。
多重响应
Failure3MultipleField.jmp 样本数据表中每个单元对应一行,缺陷包含在多个列中,每列输入一
个缺陷。在本例中,共有三个缺陷列。因此,任一个单元都至多有三个缺陷。
1. 选择帮助 > 样本数据库,然后打开 Quality Control/Failure3MultipleField.jmp。
2. 选择分析 > 消费者研究 > 分类。
3. 选择 失败 1、失败 2 和失败 3。
4. 在 “多重”选项卡上,点击多重响应。
5. 选择清洗和日期,然后点击 X,分组类别。
6. 点击确定。
54 分类响应分析 第3章
“分类”平台的更多示例 消费者研究
图 3.18 “多重响应”报表
交叉表中的每个批次对应一行,每个缺陷类型对应一列。每个批次中的频数、份额和每个缺陷的
比率都显示在表单元格中。例如,对于 10 月 1 日清洗过后的批次,有 12 个污染缺陷,表示为 12/23
或占该批次缺陷数的 52.2%。这 12 个污染缺陷来自 50 个单元。因此,每单元比率为 24%。
由 ID 标识的多重响应
在 Failure3ID.jmp 样本数据表中,每个批次中的每个缺陷类型都对应一行,有一列包含每个缺
陷类型出现的次数,并且有一个包含每个批次的 ID 列。
分隔的多重响应
在 Failures3Delimited.jmp 样本数据表中,每个单元对应一行,并且有一列记录缺陷,缺陷之间
由逗号分隔。请注意:在图 3.20 所示的部分显示的数据表中,某些单元没有观测到任何缺陷,
所以失败列为空。
注意:若指定了多个分隔列,将为每列生成单独的分析。
56 分类响应分析 第3章
“分类”平台的更多示例 消费者研究
指示符组
在 Failures3Indicators.jmp 样本数据表中,每个单元对应一行,每个缺陷类型都对应一个指示
符列。若未观测到该缺陷,则每个缺陷列中的数据条目都为 0 ;若观测到该单元存在该缺陷,则
数据条目为 1。
响应频数
在 Failure3Freq.jmp 样本数据表中,每个批次都对应一行,每个缺陷类型都对应一列,还有一
列包含批次大小。缺陷列中的数据条目是批次中出现的缺陷的频数。
7. 点击确定。
图 3.23 缺陷率输出
带比较字母的得分均值的示例
本例使用 Consumer Preferences.jmp 样本数据表探索员工任职与有学龄儿童之间的关系。员工
任职列是值为 1、 2、 3 和 4 的数值列。已使用 “值标签”列属性为这些值指定了值标签。要使
用 “分类”平台中的 “得分均值”选项评估员工任职均值,您需要为列值分配 “值得分”。有
关列属性的详细信息,请参考 《使用 JMP》手册中的 “‘列信息’窗口”一章。
1. 选择帮助 > 样本数据库,然后打开 Consumer Preferences.jmp。
2. 在该数据表中,右击员工任职列标题,然后选择列属性 > 值得分。
3. 为值输入 1 ,为得分输入 3,然后点击添加。
4. 为值输入 2,为得分输入 7.5,然后点击添加。
5. 为值输入 3,为得分输入 15,然后点击添加。
6. 为值输入 4,为得分输入 25,然后点击添加。
58 分类响应分析 第3章
“分类”平台的更多示例 消费者研究
7. 点击确定。
8. 选择分析 > 消费者研究 > 分类。
9. 选择员工任职,并在 “简单”选项卡上点击响应。
10. 选择学龄儿童并点击 X,分组类别。
11. 点击确定。
12. 点击 “分类”红色小三角并选择得分均值。
13. 点击 “分类”红色小三角并选择得分均值比较。
图 3.24 包含得分均值的分类报表
提示:在使用得分均值选项时,要注意数据的记录形式。若您的数据记录为带值标签的编码数
值数据,则均值计算基于该数值数据。若该数值数据没有意义,则使用值得分为响应水平分配
有意义的数据值。
结构化报表的示例
本例使用 Consumer Preferences.jmp 样本数据表,通过使用 “结构化”选项卡来探索比较不
同年龄组 * 性别和不同职位任期的工作满意度和薪水情况。
1. 选择帮助 > 样本数据库,然后打开 Consumer Preferences.jmp。
2. 选择分析 > 消费者研究 > 分类。
3. 选择 “结构化”选项卡。
4. 将性别拖至 “结构化”选项卡上的表顶处的绿色拖放区。
5. 将年龄组拖至性别正下方的绿色拖放区。
第3章 分类响应分析 59
消费者研究 “分类”平台的更多示例
6. 将职位任期拖至表顶处性别旁边的绿色拖放区。
7. 将工作满意度拖至表边处的绿色拖放区。
8. 将薪水组拖至表边处工作满意度下方的绿色拖放区。
图 3.25 “结构化”选项卡报表设置
9. 点击添加 =>。
10. 点击确定。
11. 点击 “分类”红色小三角并选择检验响应齐性。
图 3.26 “结构化”选项卡报表示例
“结构化”选项卡报表包含您在 “结构化”选项卡中指定的表。响应齐性检验针对每一种分组
变 量 组 合。我 们 可 以 看 到,对 于 男 性,各 年 龄 组 的 工 作 满 意 度 没 有 差 别 (Pearson p 值 =
0.9703)。对于女性,各年龄组的工作满意度有差别 (Pearson p 值 = 0.0149)。中年女性往往对
其工作最不满意。可将份额图和频数图添加到报表中,用来形象演示结果。
60 分类响应分析 第3章
“分类”平台的统计详细信息 消费者研究
“分类”平台的统计详细信息
Rao-Scott 校正
2
2 χ
χ C = ------
δ
其中
2
χ 是标准 Pearson 卡方统计量,δ 是由以下公式定义的校正因子
m ++
δ = 1 – ----------
n+ C
其中
m ++ 是多重响应的合计数
n + 是测试对象合计数
C 是响应水平数 (交叉表中的列数)。
自由度为 (R-1)C 或行数减 1 后与列数的乘积。
第4章
多重对应分析
标识分类变量各水平之间的关联
“多重对应分析”(MCA) 针对多个分类变量,试图查找这些变量各水平之间的关联。MCA 将对
应分析从两个变量扩展到多个变量的情况。您可以认为它就如同针对定量变量的主成分分析。
与其他多元方法类似,多重对应分析它是一种降维方法,将原始的多维数据表示为二维或三维
空间中的点。
在社会科学领域,经常使用多重对应分析,在法国和日本尤为普遍。可将其用在调查分析中,找
出测试对象对不同问题的态度一致性。还可以在消费者研究中使用该方法来确定产品的潜在市
场。遗传学中的微阵列研究也使用 MCA 来确定基因之间的潜在关系。
图 4.1 多重对应分析
62 多重对应分析 第4章
多重对应分析的示例 消费者研究
多重对应分析的示例
本例使用 Car Poll.jmp 样本数据表,其中包含汽车的相关调查数据。数据中包含个人背景各方
面的信息,例如:性别、婚姻状况和年龄,还包含他们拥有的汽车的属性信息,如原产国、汽
车尺寸和车型。您想探索性别、婚姻状况、原产国和汽车尺寸之间的关系以确定消费者的偏好。
1. 选择帮助 > 样本数据库,然后打开 Car Poll.jmp。
2. 选择分析 > 消费者研究 > 多重对应分析。
3. 选择性别、婚姻状况、国家和汽车尺寸,然后点击 Y,响应。
在 MCA 中,通常所有列被视为响应,而非一些列是响应,另一些列是说明变量。
4. 点击确定。
图 4.3 “多重对应分析”报表
64 多重对应分析 第4章
启动 “多重对应分析”平台 消费者研究
启动 “多重对应分析”平台
通过选择分析 > 消费者研究 > 多重对应分析启动 “多重对应分析”平台。
图 4.4 “多重对应分析”启动窗口
频数 指定一个频数变量。该选项适用于汇总数据,
依据 为 “依据”变量的每个水平生成单独报表。若分配了多个 “依据”变量,则为 “依据”
变量水平的每个可能组合生成单独报表。
“多重对应分析”报表
初始“多重对应分析”报表显示变量汇总、对应分析图和按重要性排列的数据维度的详细信息。
从类别或个体的对应图中,您可以发现数据中存在的关联。详细信息列出了图中两个维度在多
大程度上解释了数据表内关系的信息。
“变量汇总”显示分析中使用的列和您在启动窗口中选择的角色。若您选中 “显示控制项”复
选框,包含数据表中各列的列表将显示在左侧。您可以通过选择一列并点击 “添加 Y”、“添加
X”、“添加 Z”或 “添加 ID”来更改分析中的列。或者,您可以将该列拖到变量汇总表中的标
题处。如此您不必返回到启动窗口就可以修改分析设置。
“多重对应分析”平台选项
使用 “多重对应分析”红色小三角菜单选项,您可以根据自己的需要定制报表。根据您指定的
分析类型,有以下报表可供您选择。
对应分析 提供对应分析报表。这些报表给出图、详细信息、坐标和汇总统计量。请参见第 71
页的 ““多重对应分析”平台的更多示例”。
交叉表 根据所选变量角色适时提供 Burt 表或列联表。请参见第 70 页的 “交叉表”。
补充行的交叉表 提供补充变量对响应变量的列联表。仅当在启动窗口中指定了补充变量时才
默认显示该表。
补充列的交叉表 提供 “X,因子”变量对补充变量的列联表。仅当在启动窗口中指定了因子
变量和补充变量时才默认显示该表。
马赛克图 显示每个名义型或有序型响应变量的马赛克条形图。马赛克图是堆叠的条形图,其
中每组堆叠条形图的宽度与该组的频数计数成比例。仅当选择了一个 Y 和一个 X 变量时,
该选项才可用。
独立性检验 提供确定行和列变量之间是否有关联的独立性检验。该检验有两种方法:Pearson
形式和似然比形式,两者都计算卡方统计量。仅当只有一个 Y 变量和一个 X 变量时,该选
项才可用。
请参见 《使用 JMP》手册中的 “JMP 报表”一章,获取有关下列选项的信息:
恢复 包含使您可以重复运行分析或重新启动分析的选项。在支持该功能的平台中,“自动重新
计算”选项可将您对数据表所做的更改立即体现在相应的报表窗口中。
保存脚本 包含使您可以保存脚本的选项,该脚本可在多个指定位置重新生成报表。
保存 “依据”组脚本 包含使您可以保存脚本的选项,该脚本可在多个指定位置为 “依据”变
量的所有水平重新生成平台报表。仅当在启动窗口中指定 “依据”变量时才可用。
对应分析选项
根据您指定的分析类型,“对应分析”有以下选项可供您选择,其中有个别报表是默认输出。
显示图 将类别数据投影到提取的前两个主轴上的二维对应分析表。默认显示该图。
显示详细信息 提供分析的详细信息,包括奇异值、惯量、卡方统计量、百分比和累积百分比。
默认显示该报表。请参见第 67 页的 “显示详细信息”。
显示调整惯量 提 供 Benzecri 和 Greenacre 调 整 惯 量 的 报 表。请 参 见 Benzecri (1979) 和
Greenacre (1984)。该选项在有一个或多个 X 变量时不可用。请参见第 68 页的 “显示调整
惯量”。
显示坐标 提供一个报表,针对每个类别最多包含对应分析中前三个维度的坐标值,具体视情
况而定。请参见第 68 页的 “显示坐标”。
第4章 多重对应分析 67
消费者研究 “多重对应分析”平台选项
显示汇总统计量 提供一个报表,它显示分析中每个类别对应的汇总统计量、质量、量和惯量。
请参见第 68 页的 “显示汇总统计量”。
显示对惯量的部分贡献 提供一个报表,它显示每个类别对最多前三个维惯量的贡献。请参见
第 69 页的 “显示对惯量的部分贡献”。
显示平方余弦 提供一个报表,针对每个类别,显示最多前三个维的平方余弦。该报表包括一
个条形图,其中为每个 Y 变量的每个水平显示最多前三个维中每个维的平方余弦值。请参
见第 69 页的 “显示平方余弦”。
Cochran Q 检验 (仅在所有 Y 变量都仅包含相同的一组两水平并且 X 变量每行都具有唯一值
的情况下,该选项才可用。) 提供 Cochran Q 统计量,该统计量检验特定响应的边缘概率
在 各 个 Y 变 量 中 是 否 不 变。 Cochran Q 统 计 量 是 针 对 两 个 以 上 响 应 变 量 的 广 义 的
McNemar 统计量。请参见 Agresti (2002)。
三维对应分析 提供将空间中 Y、 X 和 Z 变量的类别数据投影到前三个主轴上的三维对应分析
图。若少于三个维度,则该选项不可用。
保存坐标 将主坐标保存到一个或多个 JMP 数据表。列坐标、行坐标、补充列坐标和补充行坐
标保存到单独的 JMP 数据表。您可以选择要保存的列数。
保存坐标公式 将多个维中的主坐标的公式列保存到数据表中。每个观测的值是以每个维的奇
异值统一尺度的 Y 变量坐标的平均值。您可以选择要保存的列数。
显示图
该图显示类别或单项图在前两个主轴所构成的平面上的投影,两个方向上的距离尺度相同。您
可以使用图下方的 “选择维”控件来切换图中显示的维。第一个控件定义图的水平轴,第二个
控件定义图的垂直轴。点击箭头按钮可以在图中显示的维之间循环切换。在 “选择维”控件下
方,您可以指定图中各点的大小是否应与对应每个点的观测计数成比例。
注意:选择对应分析图中的某个点也会选择报表窗口内其他表中的对应行,但并不选择该数据
表中的行。要选择图中与特定变量关联的所有点,请在图例中选择变量的名称。
显示详细信息
显示奇异值表。
奇异值 显示列联表或 Burt 表的奇异值分解中的奇异值。有关该公式,请参见第 75 页的““详
细信息”报表”。
惯量 列出奇异值的平方,反映了典型维中解释的相对变异。
卡方 列出针对 Burt 表或列联表计算的总卡方值拆分到当前维的部分。
百分比 各维惯量占总惯量的比例。
68 多重对应分析 第4章
“多重对应分析”平台选项 消费者研究
累积百分比 显示惯量的累积比例。若前两个维可以解释大部分总惯量,则二维对应分析图足
以解释表中变量之间的关系。
显示调整惯量
MCA 中 Burt 表的主惯量为特征值。这些惯量存在的问题是对拟合好坏的判定过于悲观。Benzécri
提出了一种惯量调整方法,而 Greenacre 认为 Benzécri 调整过高估计了拟合质量,因此他提出了
新的调整方法来替代。我们计算了两种调整值供您参考。请参见第 75 页的 “调整惯量”。
惯量 列出奇异值的平方,反映了典型维中解释的相对变异。
调整惯量 列出了根据 Benzécri 或 Greenacre 调整的调整惯量。
百分比 调整的惯量占总惯量的比例。
累积百分比 显示调整惯量的累积比例。若前两个维可以解释大部分总惯量,则二维对应分析
图足以解释表中变量之间的关系。
显示坐标
显示 “列坐标”表,或 “行坐标”表和 “列坐标”表。
X 列出指定为 “X,因子”变量的列。
Y 列出指定为 “Y,响应”变量的列。
Z 列出指定为 “Z,补充变量”的列。
类别 列出 X、 Y 或 Z 变量的水平。
维 1、维 2、维 3 对于每个水平或每个响应,在相应的主轴上列出其坐标。默认情况下,表中
显示最多前三个维的坐标。隐藏其他维的坐标列。要显示这些可选列,请右击某个表并从
列子菜单中选择维列。
显示汇总统计量
显示 “列点的汇总统计量”表,或 “行点和列点的汇总统计量”表。 Y 表提供每个响应的每个
水平的质量、量和惯量,这些统称为列点。 X 表为“X,因子”变量的每个水平提供质量、量和
惯量。请参见第 76 页的 “汇总统计量”。
X 列出指定为 “X,因子”变量的列。
Y 列出指定为 “Y,响应”变量的列。
类别 列出 X 和 Y 变量的水平。
质量 (维 =2) 列出按解对应水平表示下的质量。
第4章 多重对应分析 69
消费者研究 “多重对应分析”平台选项
显示对惯量的部分贡献
显示 “关于列点对惯量的部分贡献”表,或 “关于行和列点对惯量的部分贡献”表。还显示
“关于列点对惯量的部分贡献图”。这是一个条形图,其中针对每个 Y 变量的每个水平,显示其
对表中显示的每个维的部分贡献。
X 列出指定为 “X,因子”变量的列。
Y 列出指定为 “Y,响应”变量的列。
类别 列出 X 和 Y 变量的水平。
维 1、维 2、维 3 列出响应或因子水平对所指维的惯量的贡献。默认情况下,表中显示最多前
三个维的列。其他列会隐藏起来。要显示这些可选列,请右击某个表并从列子菜单中选择
维列。
每个响应的每个水平都对每个维的惯量做贡献。每个维中的部分贡献加总为 1。
显示平方余弦
显示 “列点的平方余弦”表,或 “行点和列点的平方余弦”。还显示 “列点的平方余弦图”。
这是一个条形图,其中针对每个 Y 变量的每个水平,显示最多前三个所示维中每个维的平方余
弦值。
X 列出指定为 “X,因子”变量的列。
Y 列出指定为 “Y,响应”变量的列。
类别 列出 X 和 Y 变量的水平。
维 1、维 2、维 3 列出按所指维对应水平表示下的质量。默认情况下,表中显示最多前三个维
的结果。其他列会隐藏起来。要显示这些可选列,请右击某个表并从列子菜单中选择维列。
这些值表示每个列点在相应维上的质量。平方余弦可以解释为点与维的相关性的平方。前两
个维的平方余弦之和等于 “汇总统计量”报表中的 “质量 (维 =2)”。请参见第 76 页的
“汇总统计量”。
70 多重对应分析 第4章
“多重对应分析”平台选项 消费者研究
交叉表
Burt 表是多重对应分析的基础。它是描述所有分类变量两两交叉列联的分区对称表。对角分区
是对角矩阵 (变量与其自身的交叉表) 。非对角分区是普通的列联表。当您选择多个 “Y,响
应”列且没有选择任何 “X,因子”列时,将创建 Burt 表。若您选择任何 “X,因子”列,则
创建传统的列联表而非 Burt 表。
Burt 表或列联表的红色小三角菜单包含要在表中显示的统计量的选项。
计数 单元格频数、边缘总频数和总计 (总样本大小)。默认显示该选项。
合计百分比 单元格计数和边缘合计占总计的百分比。默认显示该选项。
单元格卡方值 为每个单元格计算的卡方值,公式为 (O - E)2 / E。
列百分比 每个单元格计数占列合计的百分比。
行百分比 每个单元格计数占行合计的百分比。
期望值 在独立性假设下每个单元格的期望频数 (E)。它由相应行合计与列合计之积除以总计得到。
偏差 观测的单元格频数 (O) 减去期望的单元格频数 (E) 所得的值。
列累积 累积列合计。
列累积百分比 累积列百分比。
行累积 累积行合计。
行累积百分比 累积行百分比。
制成数据表 为表中显示的每个统计量创建一个数据表。
补充行的交叉表
选择补充列 Z 时,将创建一个列联表,它以补充列水平作为行、以响应列水平作为列。红色小
三角菜单包含与 Burt 表相同的选项。
补充列的交叉表
选择 “X,因子”列和补充列 Z 时,将创建一个列联表,它以 “X,因子”水平作为行、以 “补
充”水平作为列。红色小三角菜单包含与 Burt 表相同的选项。
第4章 多重对应分析 71
消费者研究 “多重对应分析”平台的更多示例
“多重对应分析”平台的更多示例
使用补充变量的示例
本例使用 Car Poll.jmp 样本数据表,其中包含汽车的相关调查数据。数据中包含个人背景各方
面的信息,例如:性别、婚姻状况和年龄,还包含他们拥有的汽车的属性信息,如原产国、汽
车尺寸和车型。您想了解性别、原产国和汽车尺寸之间的关系以确定消费者的偏好。
1. 选择帮助 > 样本数据库,然后打开 Car Poll.jmp。
2. 选择分析 > 消费者研究 > 多重对应分析。
3. 选择国家和汽车尺寸,然后点击 Y,响应。
4. 选择婚姻状况,然后点击 Z,补充变量。
5. 点击确定。
与第一个示例中的分析不同,该分析在计算中不包含婚姻状况这个变量,只是在分析完成后将
其标绘在图表中。
从图中可以看出,日本人和尺寸小的车之间以及美国人和尺寸大的车之间有强相关。用不同颜
色标绘两种婚姻状况,可以看出单身人士似乎比已婚人士更喜欢尺寸小的车。
72 多重对应分析 第4章
“多重对应分析”平台的更多示例 消费者研究
使用补充 ID 的示例
美国人口普查可用于查看上个世纪的人口增长率。 US Regional Population.jmp 样本数据表包
含 1920 到 2010 年间每个人口普查年份的美国 50 个州的人口数,50 个州按地区进行了分组。阿
拉斯加州和夏威夷州被视为补充地区,因为在整个普查期间它们还没建州,而且不与美国大陆
接壤。您想关注这两个州的人口增长率是否不同于美国其他州的人口增长率。
1. 选择帮助 > 样本数据库,然后打开 US Regional Population.jmp。
2. 选择分析 > 消费者研究 > 多重对应分析。
3. 选择年份,然后点击 Y,响应。
4. 选择地区,然后点击 X,因子。
5. 选择 ID,然后点击补充 ID。
6. 选择人口,然后点击频数。
7. 点击确定。
第4章 多重对应分析 73
消费者研究 “多重对应分析”平台的更多示例
“详细信息”报表显示年份和地区之间的关联几乎可以完全使用第一个维来解释。从该图可以看
出第一维度上的年份顺序符合自然规律,该排序在整个对应分析过程中自然地进行,事先没有
提供排序信息。
从地区的排序可以看出人口的迁移规律是从中西部到东北部、再到南部、最后到山地和西部。
上述对应分析的计算没有包含阿拉斯加州和夏威夷州的数据,但我们可以根据结果来标绘它们。
它们的增长模式类似于太平洋地区各州的模式,阿拉斯加州的增长率比太平洋地区更为极端。
74 多重对应分析 第4章
“多重对应分析”平台的更多示例 消费者研究
“多重对应分析”平台的统计详细信息
本节包含 “多重对应分析”的统计详细信息。
“详细信息”报表
执行简单的 “对应分析”时,报表列出的奇异值是通过以下公式计算的:
– 0.5 – 0.5
Dr ( P – rc' ) D c = UD u V ′
其中:
• P 是计数除以总频数所得的值构成的矩阵
• r 和 c 是 P 的行总和和列总和
• D 矩阵是 r 和 c 的值构成的对角矩阵
执行 “多重对应分析”时,奇异值分解扩展为:
– 0.5 C- – 0.5
D ----------
2
– D11' D D = UD u V ′
Q n
其中:
D = ---- diag ( D 1, D 2, …, D Q )
1
m
• C 是 Burt 表
• Q 是分类变量数
• n 是观测数
• 1 是由多个 1 构成的列向量
调整惯量
2
在 MCA 中从 m 个分类变量构造的 Burt 表的常见主惯量为来自 D u 的特征值 uk。 这些惯量对
于拟合好坏的判定过于悲观。Benzécri (1979) 提出了以下惯量调整方法,Greenacre 对该调整方
法进行过描述 (1984, p. 145):
m 2
------------ 1 2
- × u k – ---- (对于 u > ---
1)
-
m – 1 m k m
针对所有大于 1 ⁄ m 的惯量,该调整计算调整惯量占调整惯量之和的百分比。
Greenacre (1994, p. 156) 认为 Benzécri 调整过高估计了拟合的质量。Greenacre 建议计算调整惯
量与以下值的百分比:
76 多重对应分析 第4章
“多重对应分析”平台的统计详细信息 消费者研究
m 4 n c – m
------------- trace ( D u ) – ---------------
-
m – 1 2
m
4
(对于大于 1 ⁄ m 的所有惯量),其中 trace ( D u ) 是惯量平方和,nc 是 m 个变量上的总类别数。
汇总统计量
质量是某点距离指定维数所定义空间中的原点的平方距离与具有最大维数的空间中的原点的距
离之比。对于卡方这个量度,给定维中某点的质量可通过其向量与定义该维的向量所构成的余
弦得到。质量还等于指定维中的惯量总和与所有维中的惯量总和的比值。质量指示在低维空间
中表示点的好坏程度。
量是行或列的总频数与总频数之比。
惯量类似于主成分分析中的方差。整体惯量是二维频数表的总 Pearson 卡方除以表中所有观测
值总和得到的值。
相对惯量是点对总惯量的贡献比例。在汇总统计量表中,相对惯量列在标记为“惯量”的列中。
对惯量的部分贡献
按以下公式计算行或列对维的惯量的贡献:
2
mass × coordinate
contribution = -------------------------------------------------------
dimensioninertia
第5 章
多维尺度化
直观表示一组对象间的邻近性
图 5.1 多维尺度化示例
78 多维尺度化 第5章
“多维尺度化”平台概述 消费者研究
“多维尺度化”平台概述
“多维尺度化”平台生成一组对象之间的邻近关系图。该图可用于直观探索数据集内的结构。
MDS 是一种多元方法,用于分析一组对象间的邻近性 (相似性或距离),以较少的维将它们之
间的关系进行可视化展现。 MDS 适用于距离矩阵。 MDS 图的坐标通过最小化应力函数 (实际
和预测邻近关系的差异)来获取。
距离一词可指一种物理距离 (比如城市之间的距离)测度。更多情况下,距离只是一种客观评
估而不是精确测量。邻近关系可测量不同品牌产品之间的感知相似度、犯罪率相关性度或样本
国家 / 地区的经济相似度。距离还可称为邻近关系或相似性(相异性)。若数据作为特性列表提
供,则首先从特性列表的相关性结构入手构造距离矩阵。
有关多维尺度化的详细信息,请参见 Borg and Groenen (2005) 或 Jackson (2003)。
多维尺度化示例
本例使用 Flight Distances.jmp 样本数据表,该表是美国 28 个城市之间的飞行距离的距离矩
阵。您可以基于数据表中两两城市间的距离使用 MDS 构造二维城市地图。
1. 选择帮助 > 样本数据库,然后打开 Flight Distances.jmp。
2. 选择分析 > 消费者研究 > 多维尺度化。
3. 从伯明翰一直选到华盛顿特区,然后点击 Y,列。
第5章 多维尺度化 79
消费者研究 多维尺度化示例
4. 点击确定。
5. 选择 Flight Distances 数据表。
6. 右击列城市,然后选择添加标签 / 撤销标签。
7. 选择行 > 行选择 > 选择所有行。
8. 选择行 > 添加标签 / 撤销标签。
9. 选择 “多维尺度化图”。
10. 点击垂直翻转按钮。
11. 点击水平翻转按钮。
“垂直翻转”和“水平翻转”按钮支持您更改 MDS 图的方向。MDS 结果不受方向影响。若
方向在结果中是已知的,如物理位置,则您可能需要旋转或翻转您的图形。
80 多维尺度化 第5章
多维尺度化示例 消费者研究
图 5.3 多维尺度化图
第5章 多维尺度化 81
消费者研究 启动 “多维尺度化”平台
启动 “多维尺度化”平台
通过选择分析 > 消费者研究 > 多维尺度化启动 “多维尺度化”平台。
图 5.4 “多维尺度化”启动窗口
注意:使用距离矩阵时,“依据”变量要求为 “依据”变量的每个水平生成完整矩阵。
“多维尺度化”报表
初始 “多维尺度化”报表显示以下报表:“多维尺度化图” 、“Shepard 图”和 “拟合详细信
息”。若在启动窗口中为拟合指定了三维或多维,“多维尺度化图”则提供相应的控件选项供您
选择查看相应的维度分析。
MDS 图上 距离 相近 的对象 具有 类似 的特 征。向 图中 添加 标签 和颜 色有 助于 发现 类似 组。
Shepard 图和拟合汇总统计量提供一些测度,用于衡量 MDS 图在多大程度上反映了对象间的邻
近性。
多维尺度化图
MDS 图将多维尺度分析结果在二维空间进行展示。该图下方有两个按钮,分别用于在垂直和水
平方向上翻转轴。可以反射、旋转或转换 MDS 解,而不会改变点间的邻近关系。在处理具有已
知地图方向的地理位置时,对轴进行旋转或反射是最常用的。
若在分析中使用了两个以上的维,则可以使用图下方的选择维控件切换该图中显示的维。第一
个控件定义图的水平轴,第二个控件定义图的垂直轴。
Shepard 图
Shepard 图是实际或变换的邻近关系与预测邻近关系的对比图。该图反映了多维尺度分析图在
多大程度上反应了实际的邻近性。 Shepard 图类似于 “预测值 - 实际值”图。理想情况下,这
些点落在 Y = X 线上 (这条线显示为红色)。
拟合详细信息
“拟合详细信息”提供了汇总统计量以衡量 MDS 邻近性与实际邻近性之间的吻合程度,同时还
在使用变换时提供关于变换的详细信息。
应力 在拟合过程中最小化的应力函数 (Stress1) 的值。应力可介于 0 和 1 之间,较低的值表示
较好的拟合。
R 方 “实际或变换的邻近关系 - 预测的邻近关系”的线性拟合的 R2 值。
斜率 若使用了比或区间变换,则提供变换的斜率。这是实际邻近关系针对变换的邻近关系的
线性回归的斜率。
截距 若使用了区间变换,则提供变换的截距。这是实际邻近关系针对变换的邻近关系的线性
回归的截距。
第5章 多维尺度化 83
消费者研究 “多维尺度化”平台选项
“多维尺度化”平台选项
使用 “多维尺度化”红色小三角菜单选项,您可以根据自己的需要定制报表。可用选项取决于
您用于分析的数据类型和维数。
MDS 图 显示或隐藏 MDS 图。
诊断 提供 MDS 的诊断
显示实际邻近关系 (若使用变换,则为变换的邻近关系)与预测的邻近关系的
Shepard 图
对比图。默认显示该报表。请参见 “Shepard 图”。
Waern 链接 在 MDS 图上显示 Waern 链接。选定该选项时,将可以使用针对此部分 (最小
或最大)的控件。请参见 “Waern 链接”。
显示坐标 提供解坐标报表。这些是多维尺度化图上的点的坐标。该报表显示至多三个维的坐
标。右击该报表并选择列可将更多维添加到报表中。最大维数是在启动窗口中设置的维数。
显示邻近关系 显示邻近关系报表。在每对对象之间都提供了原始和派生的邻近关系(距离)。
对象对在“从”和“至”对象列中标识。若使用了变换,变换的邻近关系也包含在该表中。
保存邻近关系 (仅当数据格式是 “特性列表”时可用。)将距离矩阵保存到数据表中。
3D 图 (仅当在启动窗口中为 “设置维”指定了三个或更多维时才可用。)显示前三个维的 3D 图。
保存坐标 将解坐标保存到数据表中的单独列内。
请参见 《使用 JMP》手册中的 “JMP 报表”一章,获取有关下列选项的信息:
本地数据过滤器 显示或隐藏本地数据过滤器,该过滤器使您可以过滤特定报表中使用的数据。
恢复 包含使您可以重复运行分析或重新启动分析的选项。在支持该功能的平台中,“自动重新
计算”选项可将您对数据表所做的更改立即体现在相应的报表窗口中。
保存脚本 包含使您可以保存脚本的选项,该脚本可在多个指定位置重新生成报表。
保存 “依据”组脚本 包含使您可以保存脚本的选项,该脚本可在多个指定位置为 “依据”变
量的所有水平重新生成平台报表。仅当在启动窗口中指定 “依据”变量时才可用。
Waern 链接
Waern 链接控件
“多维尺度化”平台的更多示例
本例使用 Teeth.jmp 样本数据表,该数据表是关于 32 种哺乳动物的八种牙齿的计数的特性列
表。您可以基于哺乳动物的牙齿特性数据使用 MDS 探索其相似性。使用区间变换来演示该变换
的输出。数据确实具有有意义的排序 (两颗牙齿的数量是四颗牙齿的两倍之多) 。您可以探索
其他变换,如有序型变换。
1. 选择帮助 > 样本数据库,然后打开 Teeth.jmp。
2. 右击列哺乳动物,然后选择添加标签 / 撤销标签。
3. 选择行 > 行选择 > 选择所有行。
4. 选择分析 > 消费者研究 > 多维尺度化。
第5章 多维尺度化 85
消费者研究 “多维尺度化”平台的更多示例
5. 从上门齿一直选择到下臼齿,然后点击 Y,列。
6. 选择数据格式 > 特性列表。
7. 选择变换 > 区间。
8. 点击确定。
图 5.6 “多维尺度化”报表
86 多维尺度化 第5章
“多维尺度化”平台的统计详细信息 消费者研究
“多维尺度化”平台的统计详细信息
JMP 使用拟牛顿优化法通过最小化应力函数来确定 MDS 坐标。这种最小化会根据拟合前确定
的维数生成一组坐标值,以最小化多维空间里对象间的派生的邻近性测度值。若数据为有序型,
则使用单调回归。否则使用标准最小二乘回归。
应力
使用以下符号定义应力;
• I - 为拟合指定的维数
• i, j - 对象数的索引
• dij - 对象 i 与 j 之间的距离
• δij - 对象 i 与 j 之间的派生距离
• f ( δ rs ) - 距离的变换函数
应力函数的表达式如下:
2 1---
[ f ( δij ) – d ij ] 2
i<j
应力 = ------------------------------------------
-
2
ij d
i<j
变换
本节使用第 86 页的 “应力”中所述的符号。使用变换来对实际的邻近性进行尺度变换。考虑到
数据中的特定结构,变换被认为能够改进 MDS 对实际邻近性的呈现。变换函数中的参数在最小
化算法中变为额外参数。
比变换
对于比数据:
f ( δ rs ) = bδ rs
第5章 多维尺度化 87
消费者研究 “多维尺度化”平台的统计详细信息
区间变换
对于区间数据:
f ( δ rs ) = a + b δ rs
有序型变换
对于有序型数据,数据不进行变换,算法使用单调回归而不是最小二乘回归。
特性列表格式
若数据采用特性列表格式,数据将转换为距离矩阵,然后应用 MDS。距离矩阵由数据的相关性结构
来确定。
有关 MDS 的高级示例,请参见 San Francisco Crime Distances.jmp 样本数据表和该表的源脚本。
88 多维尺度化 第5章
“多维尺度化”平台的统计详细信息 消费者研究
第6 章
因子分析
标识变量内的因子
因子分析旨在用少量 (不可见)的潜在变量或因子描述大量的可观测变量。因子分析也称为公
因子分析和探索性因子分析。这些因子可以定义为观测变量的线性组合,旨在解释观测变量中
的共有变异。因子分析的主要目的是通过因子来更好的解释观测变量之间的关系,除此之外我
们还可以减少变量数。
因子分析在许多领域中都得到了广泛的应用,尤其是在心理学、社会学和教育领域中其更具有
特殊的价值。在这些领域中,因子分析有助于理解如何通过潜在模式和结构来解释表象行为。例
如,用来衡量参与户外活动、爱好、锻炼和旅游的测度可能全都与可描述为 “个性活跃 / 不活
跃”的因子相关。因子分析尝试通过因子来解释观测变量之间的相关性。特别地,针对每个可
观测变量,您可以通过因子分析确定所识别的因子对其方差的解释程度。同时,对于所有变量,
因子分析还可以为您揭示每个因子对其方差的解释程度。
在您需要探索或解释数据中的潜在模式和结构时可使用因子分析。还可考虑通过因子分析借助
少量的潜在变量来汇总变量中的信息。
图 6.1 旋转的因子载荷
90 因子分析 第6章
“因子分析”平台概述 消费者研究
“因子分析”平台概述
因子分析根据较小数量的未观测的因子对一组可观测的变量建模。这些因子可解释观测变量之
间的相关性或协方差。因子提取之后,可以通过因子旋转来获取有意义的因子解释。
考虑有十个观测变量的情形:X1, X2, …, X10。假定您想要根据两个潜在因子 F1 和 F2 对这十个
变量建模。为方便起见,假定这些因子之间不相关,而且每个因子的均值为 0,方差为 1。您想
要得到的模型形式如下:
X i = β i0 + β i1 F 1 + β i2 F 2 + ε i
2 2
由 此 可 以 得 出 Var ( X i ) = β i1 + βi2 + Var ( ε i ) , 其 中 可 归 因 于 因 子 的 Xi 的 方 差 部 分 为
2 2
β i1 + β i2 ,我们称之为公共方差或公因子方差。而剩余方差 Var ( ε i ) 是特殊方差,被视为 Xi 所
特有。
“因子分析”平台为相关性或协方差矩阵的特征值提供了一张陡坡图。您可以根据陡坡图来确定
要提取的因子数。或者,您可以接受平台的建议:将因子数设置为大于 1 的特征值的数目。
该平台提供两种因子分解方法来估计该模型的参数:主成分和最大似然。
JMP 提供了两个选项用来估计公因子针对每个变量贡献的方差比例。这些 “先验公因子方差”
选项针对相关性 (或协方差)矩阵的对角线有不同的假设前提。“主成分”选项从相关性矩阵
(对角线元素为 1)或协方差矩阵 (对角线元素为变量的方差)出发进行后续分析,而 “公因
子分析”选项将对角线元素设置为与其他变量共有的变异比例。
为了让提取的因子更加容易解释,您可以旋转因子结构。“因子分析”平台提供了多种旋转方
法,其中包含正交旋转和斜交旋转。
与考虑公共方差的因子分析相比,主成分分析解释观测变量的总方差。请参见 《多元方法》手
册中的 “主成分”一章。
“因子分析”平台的示例
要查看两个因子的数据表的 “因子分析”报表示例,请执行以下步骤:
1. 选择帮助 > 样本数据库,然后打开 Solubility.jmp。
2. 选择分析 > 消费者研究 > 因子分析。
“因子分析”启动窗口随即显示。
3. 选择所有连续列并点击 Y,列。
4. 保留默认的估计方法和方差统一尺度。
5. 点击确定。
初始 “因子分析”报表随即显示。
第6章 因子分析 91
消费者研究 “因子分析”平台的示例
图 6.2 初始 “因子分析”报表
6. 为 “模型启动”选择以下选项:
‒ “因子分解方法”为最大似然
‒ “先验公因子方差”为公因子分析
‒ 因子数 = 2
‒ “旋转方法”为 最大方差法
7. 完成所有选择后,点击执行。
“因子分析”报表随即显示。
92 因子分析 第6章
“因子分析”平台的示例 消费者研究
图 6.3 “因子分析”报表示例
该报表列出公因子方差估计值、方差、显著性检验、旋转的因子载荷和因子载荷图。我们可以
看到,在 “因子载荷图”中,“因子 1”与四氯化碳 - 氯仿 - 苯 - 己烷这一组变量相关,“因子
2”与乙醚 –1- 辛醇这一组变量相关。请参见第 98 页的 “因子分析模型拟合选项”,了解有关
报表中所显示信息的详细信息。
第6章 因子分析 93
消费者研究 启动 “因子分析”平台
启动 “因子分析”平台
通过选择分析 > 消费者研究 > 因子分析启动 “因子分析”平台。
图 6.4 “因子分析”启动窗口
Y,列 列出要分析的连续列。
权重 使您可以进行加权分析,以解释预先汇总好的数据。
频数 标识某一列,该列的数值为分析中的每个行分配一个频数。
依据 为 “依据”列所指定的每个值创建 “因子分析”报表,因此您可以针对每组进行单独的
分析。
估计方法 列出用于拟合模型的不同方法。有关方法的详细信息,请参见 《多元方法》手册中
的 “多元”一章。
方差统一尺度 列出三种执行因子分析所用的统一尺度方法:相关性 (与 “主成分”相同) 、
协方差或未统一尺度。
“因子分析”报表
初始 “因子分析”报表显示了 “特征值”和 “陡坡图” 。“特征值”从主成分分析获得,“陡
坡图”是对这些特征值绘制的图形。 JMP 建议 “模型启动”中的因子数设置为大于 1.0 的特征
值的数目。
或者,您可以使用陡坡图来指导自己在初始阶段如何选择因子数,在陡坡图平坦之前出现的特
征值数可以作为因子数的上限。
94 因子分析 第6章
“因子分析”报表 消费者研究
图 6.5 “因子分析”报表
在图 6.5 所示的示例中,“陡坡图”在第二个特征值后开始变得平坦。该“特征值”表显示第一
个特征值解释了变异的 79.75%,第二个特征值解释了 15.75%。因此,前两个特征值共解释了总
变异的 95.50%。第三个特征值仅解释了 2.33% 的变异,而其余特征值的贡献可忽略不计。尽管
因子数框最初设置为 1,该分析建议提取 2 个因子才是合理的。
模型启动
要配置 “因子分析”模型,请使用 “因子分析”报表底部的 “模型启动”部分 (图 6.6)。
图 6.6 模型启动
第6章 因子分析 95
消费者研究 “因子分析”报表
“模型启动”部分支持您配置以下选项:
1. 因子分解方法 — 用于提取因子的方法。
‒ 主成分方法计算效率高,但它不提供假设检验。
‒ 最大似然方法具有估计的优良性,同时您还可以进行公因子数目的假设检验。
注意:最大似然方法要求正定相关性矩阵。若相关性矩阵不是正定矩阵,请选择主成分方法。
2. 先验公因子方差 — 公因子对每个变量的方差贡献比例的估计方法。
‒ 主成分 (对角线 =1)将所有公因子方差设置为 1,表明每个变量的全部方差都与其他变
量共同拥有。在 “因子分解方法”设置为主成分时使用该选项将生成主成分分析。
‒ 公因子分析(对角线 =SMC)将公因子方差设置为多重相关平方 (SMC) 系数。对于给定
的变量, SMC 即为该变量对其他所有变量作回归的 R 方。
3. 因子数 (或主成分),由大于等于 1.0 的特征值确定,或通过陡坡图中图形变平坦的临界点
来确定。
4. 旋转方法,使因子方向与原始变量保持一致,以便于解释。默认设置为最大方差法。请参见
第 95 页的 “旋转方法”,了解不同旋转方法的说明。
5. 点击执行以生成 “因子分析”报表。
根据选定的 “方差统一尺度”,您可以得到相应的因子分析结果。请参见第 98 页的 “因子
分析模型拟合选项”,了解有关报表内容的详细信息。“基于相关性的因子分析”报表和“基
于未统一尺度的因子分析”报表显示了相同的信息。
旋转方法
旋转根据原始变量调整因子的方向以使得因子更加容易解释。您会希望存在几组高度相关的变
量,从而可以更好地定义旋转因子。
初始提取之后的因子彼此之间是不相关的。若因子是通过正交变换旋转的,则旋转之后的因子
也不相关。若因子是通过斜交变换旋转的,则旋转之后的因子就会彼此相关。斜交旋转往往生
成比正交旋转更有用的模式。不过因子相关后,在考察对变量的解释时,很难衡量各因子的重
要性。
正交旋转方法
表 6.1 正交旋转方法
直交旋转法 ROTATE=ORTHOMAX
或
ROTATE=ORTHOMAX(p),其中 p 是直交旋转法权重或 GAMMA
= 值。
注意:默认 p 值为 1,除非在 GAMMA = 选项中另行指定。有关直
交旋转法权重的其他信息,请参见 SAS 文档“Simplicity Functions
for Rotations”。
( nvar ( nfact – 1 ) )
Parsimax ROTATE=ORTHOMAX,且 GAMMA = -------------------------------------------
( nvar + nfact – 2 )
其中 nvar 是变量数, nfact 是因子数。
斜交旋转方法
表 6.2 斜交旋转方法
双四次幂极小法 ROTATE=OBLIMIN(.5)
或
ROTATE=OBLIMIN,且 TAU=.5
协方差极小法 ROTATE=OBLIMIN(1)
或
ROTATE=OBLIMIN,且 TAU=1
斜交双四次幂极大法 ROTATE=OBBIQUARTIMAX
第6章 因子分析 97
消费者研究 “因子分析”平台选项
斜交相等最大值法 ROTATE=OBEQUAMAX
斜交 Parsimax 法 ROTATE=OBPARSIMAX
四次最大正交旋转法 ROTATE=OBQUARTIMAX
方差最大旋转法 ROTATE=OBVARIMAX
斜交旋转法 ROTATE=PROMAX
“因子分析”平台选项
通过点击报表窗口中的 “因子分析”红色小三角菜单可访问以下选项:
特征值 提供基于特征值 (即:每个因子的方差贡献量)提取的总因子数的表。该表包含因子
的方差贡献百分比、贡献百分比的条形图,以及每个后续因子所贡献的累积百分比。大于
等于 1.0 的特征值的数目可被视为合适的因子数以进行因子分析。
陡坡图 成分 (因子)数与特征值图。该图可用于确定提供了最大方差贡献率的因子数。标绘
线变得平坦处的临界点可被视为足以执行分析的因子数。有关陡坡图的示例,请参见第 91
页的图 6.2。
请参见 《使用 JMP》手册中的 “JMP 报表”一章,获取有关下列选项的信息:
本地数据过滤器 显示或隐藏本地数据过滤器,该过滤器使您可以过滤特定报表中使用的数据。
恢复 包含使您可以重复运行分析或重新启动分析的选项。在支持该功能的平台中,“自动重新
计算”选项可将您对数据表所做的更改立即体现在相应的报表窗口中。
保存脚本 包含使您可以保存脚本的选项,该脚本可在多个指定位置重新生成报表。
保存 “依据”组脚本 包含使您可以保存脚本的选项,该脚本可在多个指定位置为 “依据”变
量的所有水平重新生成平台报表。仅当在启动窗口中指定 “依据”变量时才可用。
98 因子分析 第6章
因子分析模型拟合选项 消费者研究
因子分析模型拟合选项
提交 “模型启动”后,模型结果随即显示。“因子分析”报表的红色小三角菜单提供以下选项:
先验公因子方差 每个变量的公因子方差的初始估计值。对于给定的变量,该估计值是多重相
关平方 (SMC) 系数,即该变量对其他所有变量构建回归模型得到的 R 方。
图 6.7 先验公因子方差估计值
特征值 显示简化相关性矩阵的特征值以及这些特征值解释的公共方差百分比。简化相关性矩
阵是对角线元素被公因子方差估计值取代的相关性矩阵,特征值表明因子所解释的公共方
差。“累积百分比”可超过 100%,因为简化相关性矩阵不一定是正定矩阵,可以包含负特
征值。
请注意,该表指出了进行后续分析保留的因子数。
仅当 “先验公因子方差”选项设置为 “公因子分析 (对角线 =SMC)”时,“特征值”选
项才可用。公因子方差估计值是 SMC (多重相关的平方)值。
图 6.8 指出前两个因子解释了 100% 的公共方差,该结果表明您可能不需要两个以上因子就
可对数据建模。
图 6.8 简化相关性矩阵的特征值
未旋转的因子载荷 显示旋转之前的因子载荷矩阵。因子载荷测量公因子对变量的影响。由于
未旋转的因子是正交的,因此该因子载荷矩阵是变量与因子之间的相关性矩阵。载荷的绝
对值越接近 1,因子对变量的影响就越大。
使用滑块或输入相应值来隐藏小于该值的绝对载荷值(该值即表中的指定值)。隐藏的值会
根据文本变暗所指定的设置相应地变暗。
使用文本变暗滑块或输入相应值,控制绝对值比隐藏小于该值的绝对载荷值的指定值小的
因子载荷值的字体透明度梯度。
第6章 因子分析 99
消费者研究 因子分析模型拟合选项
注意:隐藏小于该值的绝对载荷值和文本变暗设定值与“旋转的因子载荷”表中使用的值相同。
针对一个载荷表设置的更改将同时更改其他载荷表中的设置。
图 6.9 未旋转的因子载荷
注意:“未旋转的因子载荷”矩阵是重新排序过的,因此与同一因子关联的变量会显示在彼此上下。
旋转矩阵 用于对因子载荷图和因子载荷矩阵进行旋转。
图 6.10 旋转矩阵
图 6.11 目标矩阵
因子结构 显示变量与公因子之间的相关性的矩阵。该选项仅适用于斜交旋转。
图 6.12 因子结构
100 因子分析 第6章
因子分析模型拟合选项 消费者研究
最终公因子方差估计值 拟合因子模型后得到的公因子方差估计值。若因子是正交的,变量的
最终公因子方差估计值等于该变量的因子载荷平方和。
图 6.13 最终公因子方差估计值
标准得分系数 列出将旋转后的因子保存至源数据表时用于转换因子值的乘数。
图 6.14 标准得分系数
每个因子解释的方差 提供每个旋转因子解释的方差、方差贡献百分比和累积百分比。
图 6.15 每个因子解释的方差
显著性检验 若将最大似然选作因子分解方法,将提供以下两个卡方检验结果。
第一个检验的 H0 为无公因子。该原假设指出没有任何公因子可以解释变量之间的交互相
关。该检验为 Bartlett 球形检验,其原假设为:因子的相关性矩阵是一个单位矩阵 (Bartlett,
1954)。
第二个检验的 H0 为 N 个因子足够多,其中的 N 是指定的因子数。拒绝该原假设指出需要
更多因子来解释变量之间的交互相关 (Bartlett, 1954)。
图 6.16 中的检验表明模型中包含的公因子可以解释部分交互相关,但还需要更多因子。
注意:仅当选定最大似然因子分解方法选项时,“显著性检验”表才会显示。
第6章 因子分析 101
消费者研究 因子分析模型拟合选项
图 6.16 显著性检验
旋转的因子载荷 显示旋转之后的因子载荷矩阵。若为正交旋转,这些值为变量与旋转因子之
间的相关性。
使用滑块或输入相应值来隐藏小于该值的绝对载荷值(该值即表中的指定值)。隐藏的值会
根据文本变暗所指定的设置相应地变暗。
使用文本变暗滑块或输入相应值,控制绝对值比隐藏小于该值的绝对载荷值的指定值小的
因子载荷值的字体透明度梯度。
注意:隐藏小于该值的绝对载荷值和文本变暗设定值与“未旋转的因子载荷”表中使用的值
相同。针对一个载荷表设置的更改将同时更改其他载荷表中的设置。
图 6.17 旋转的因子载荷
注意:“旋转的因子载荷”矩阵是重新排序过的,因此与同一因子关联的变量会显示在彼此
上下。
因子载荷图 旋转的载荷因子图。
102 因子分析 第6章
因子分析模型拟合选项 消费者研究
图 6.18 因子载荷图
图 6.19 得分图
完成补缺的得分图 补缺所有缺失值并创建得分图。该选项仅在包含缺失值时可用。
显示选项 允许您显示或隐藏带有箭头的所有图上的箭头。
第6章 因子分析 103
消费者研究 因子分析模型拟合选项
保存旋转成分 将旋转成分保存至数据表,其中包含用于计算成分的公式。该公式无法对包含
缺失值的行求值。
保存完成补缺的旋转成分 先对缺失值进行补缺,然后将旋转成分保存至数据表。列中包含用
于执行补缺和计算旋转成分的公式。在使用 “因子分析”选项后,若存在缺失值,则显示
该选项。
删除拟合 从“因子分析拟合模型”报表中删除拟合模型结果。该选项支持您更改“模型启动”
配置以生成新的报表。
104 因子分析 第6章
因子分析模型拟合选项 消费者研究
第7章
选择模型
针对选择实验拟合模型
使用 “选择”平台可分析市场研究过程中执行的选择实验的结果,以便发现您的潜在客户偏好
哪种产品或服务特性。您可以使用上述信息来设计具有消费者最喜爱的特性的产品或服务。
“选择”平台支持您执行以下操作:
• 使用有关测试对象特点以及产品特性的信息。
• 分析选择实验,响应者可在实验中选择 “以上都不是”。
• 整合来自一个、两个或三个源的数据。
• 使用集成的刻画器来了解、可视化和优化响应 (效用)曲面。
• 获取基于测试对象级别的得分以用于对数据的细分或聚类。
• 使用 Bayes 方法估计特定于测试对象的系数。
• 使用修正偏倚的最大似然估计量 (Firth, 1993)。
图 7.1 “选择”平台的效用刻画器
106 选择模型 第 7章
“选择建模”平台概述 消费者研究
“选择建模”平台概述
选择建模最早由 McFadden (1974) 提出,它是一种功能强大的分析方法,用于估计个体从现有
备择方案中做出特定选择的概率。选择建模也被称为联合选择建模、离散选择分析和条件
Logistic 回归。
选择实验研究客户对于一组产品或流程 (针对服务的情况)特性的偏好。为响应者提供的若干
产品特性组合称为特征。为每个响应者提供一小组特征集合 (称为选择集) ,让他们选择自己
最偏好的选项。通常会给每个响应者都提供若干选择集。使用 “选择”平台可分析选择实验的
结果。
由于客户对于特性有不同评价,许多市场研究人员将市场细分视为分析选择实验的重要步骤。
不这样做,您设计出的产品或流程取悦的可能就是根本不存在的 “一般”客户,从而忽略了真
正存在的细分市场的偏好。
有关选择建模的背景信息,请参见 Louviere et al. (2015)、 Train (2009) 和 Rossi et al. (2006)。
“选择”平台
“选择建模”平台使用条件 Logistic 回归的形式估计偏好某种配置的概率。不同于简单 Logistic
回归,选择建模使用线性模型对选择与否进行建模时,不仅仅基于测试对象的特征,同时还基
于响应特性。在选择建模中,响应者可能会在两辆车中进行选择,而这些车可通过以下 10 种不
同特性的组合来描述:价格、载客人数、茶杯架数、颜色、GPS 设备、汽油里程数、防盗系统、
可拆卸的座位、安全装置数和保险费用。
“选择”平台允许响应者在一组特征中不做选择。无选择选项被视作允许响应者选择的具有单个
特性 (选择 “以上都不是”)的产品。随后可根据模型假设通过多种方式解释 “无选择”特性
的参数估计值。“选择”平台还支持您获取测试对象级别信息,这些信息有助于对偏好模式进行
细分。
您可以获取修正偏倚的最大似然估计量,如 Firth (1993) 所述。已证实该方法与没有修正偏倚的
MLE 相比能够得到更好的估计值和检验。此外,修正偏倚的 MLE 可缓解 Logistic 模型中常见
的分离问题。有关 Logistic 回归中的分离问题的讨论,请参考 Heinze and Schemper (2002)。
注意:“选择”平台不适用于涉及排名、评分或嵌套分层选择的拟合模型。您可以使用 SAS/ETS
中的 PROC MDC 进行这些分析。
在开发产品和服务时运用选择设计
尽管客户满意度调查可以揭示产品或服务哪些方面做得不够好,但是对于特定的产品特性,它
们无从得知消费者的偏好。工程师设计产品时,通常会进行数百或数千个小的设计决策。若客
第7章 选择模型 107
消费者研究 “选择”平台的示例
细分
市场研究人员有时想分别分析不同测试对象的偏好结构,以查看是否存在不同表现行为的群
体。但是,对于一般的估计,通常没有足够的数据来进行类似的分析。若有足够的数据,可以
在 “响应数据”中将测试对象标识符指定为 “依据组”,或者您还可以引入测试对象标识符作
为测试对象级的模型项。不过若测试对象人数很多的话,此方法的成本会很高。
若没有足够数据指定 “依据组”,则可以使用 “按对象保存梯度”选项对测试对象进行聚类的
方法在 JMP 中进行细分。该选项创建一个新数据表,其中包含每个测试对象各参数的平均
Hessian 比例梯度。相关示例,请参见第 138 页的 “细分示例”。有关梯度值的详细信息,请参
见第 155 页的 “梯度”。
在 JMP Pro 中,您可以请求 “选择”平台使用分层 Bayes 方法以便于市场细分。 Bayes 建
模在选择模型中提供特定于测试对象的模型参数估计值 (亦称成分效用值) ,可通过层次聚类
或其他某类聚类分析来分析这些估计值,从而揭示细分市场。
“选择”平台的示例
“无选择”的单表格式
在比萨饼偏好的研究中,每个响应者都要从四个选择集中进行选择,每个选择集又含有两个特
征。某些响应者对任一个特征都不表示偏好。这些数据以单表格式显示。若某个响应者不表示
偏好,则为该响应者输入的选择指示符为缺失。
1. 选择帮助 > 样本数据库,然后打开 Pizza Combined No Choice.jmp。
通过对象和试验的组合来定义选择集。请注意,指示符列中某些选择集的值缺失。
2. 选择分析 > 消费者研究 > 选择。
“一个表,堆叠”数据格式是默认格式。
3. 点击选择数据表。
4. 选择 Pizza Combined No Choice,然后点击确定。
5. 按如下所示完成启动窗口:
‒ 选择指示符,然后点击响应指示符。
‒ 选择试尝者,然后点击对象 ID。
108 选择模型 第 7章
“选择”平台的示例 消费者研究
‒ 选择试验,然后点击选择集 ID。
‒ 选择馅饼皮、奶酪和馅料,然后在 “构造特征效应”面板中点击添加。
‒ 选择性别,然后在 “构造对象效应 (可选)”面板中点击添加。
图 7.2 完成的启动窗口
“效应汇总”报表按显著性高低显示效应。奶酪是显著性最高的效应,随后是 “无选择指示
符”,它被视为模型效应。对象效应交互作用性别 * 馅料和性别 * 馅饼皮也很显著,这表明
不同性别的细分市场对馅料和馅饼皮的偏好不同。
要深入了解 “无选择”响应的本质,请选择并查看结果为 “无选择”的那些选择集。
8. 在数据表中,右击指示符列中缺失响应的某个单元格,然后选择选择匹配单元格。
9. 在 “行”面板中,右击已选定,再选择数据视图。
110 选择模型 第 7章
“选择”平台的示例 消费者研究
图 7.4 带有 “无选择”响应的选择集
多表格式
在本例中,供测试对象选择的比萨饼包含三个特性 (每个特性有两个水平)。
该示例使用三个数据表:Pizza Profiles.jmp、 Pizza Responses.jmp 和 Pizza Subjects.jmp。
1. 选择帮助 > 样本数据库,然后打开 Pizza Profiles.jmp、 Pizza Responses.jmp 和 Pizza
Subjects.jmp。
‒ 特征数据表 Pizza Profiles.jmp 列出了您要提供给测试对象的所有比萨饼选择组合。每个
选择组合都有自己的一个 ID。
‒ 响应数据表 Pizza Responses.jmp 包含设计和结果。在实验中,为每个测试对象提供四
个选择集,每个选择集都包含两个选择特征 (选择 1 和选择 2)。测试对象为每个选择
集选择一种偏好 (选择)。有关如何构造选择设计的信息,请参见 《实验设计指南》中
的 “离散选择设计”一章。请注意,选择列中的每个值都是 “特征”数据表中包含特性
信息的 ID 值。
‒ 对象数据表 Pizza Subjects.jmp 包括一个对象 ID 列和测试对象的一个特征 — 性别。
Pizza Subjects.jmp 数据表中的每个对象值都与 Pizza Responses.jmp 数据表中的对象
列中的值相对应。
2. 选择分析 > 消费者研究 > 选择以打开启动窗口。
第7章 选择模型 111
消费者研究 “选择”平台的示例
注意:可以从三个打开的数据表中的任一个执行该操作。
3. 从 “数据格式”菜单中,选择多个表,交叉引用。
窗口分为三个不同部分,每个部分对应一个数据源。
4. 在 “特征数据”下点击选择数据表。
将显示 “特征数据表”窗口,该窗口提示您指定特征数据所在的数据表。
5. 选择 Pizza Profiles.jmp,然后点击确定。
6. 选择 ID 并点击特征 ID。
7. 选择馅饼皮、奶酪和馅料并点击添加。
图 7.5 特征数据
8. 点击 “响应数据”旁边的展开图标以打开该分级显示项,然后点击选择数据表。
9. 选择 Pizza Responses.jmp,然后点击确定。
10. 执行以下操作:
‒ 选择选择,然后点击已选择的特征 ID。
‒ 选择选择 1 和选择 2,然后点击特征 ID 选择。
‒ 选择对象,然后选择对象 ID。
112 选择模型 第 7章
“选择”平台的示例 消费者研究
图 7.6 “响应数据”窗口
图 7.7 “对象数据”窗口
15. 点击运行模型。
第7章 选择模型 113
消费者研究 “选择”平台的示例
图 7.8 “选择模型”结果
在模型中输入了六个效应。效应馅饼皮、奶酪和馅料是产品特性。交互作用效应 — 性别 * 馅
饼皮、性别 * 奶酪和性别 * 馅料 — 是测试对象和产品特性的交互作用效应。分析这些交互作
用效应,您可以打造不同的产品以满足不同细分市场的偏好。
注意:对于选择模型,对象效应无法输入为主效应。它们只显示为交互作用项。
“效应汇总”报表和 “似然比检验”报表显示性别和馅饼皮以及性别和馅料之间较强的交互
作用。请注意,主效应馅饼皮和馅料不显著。若您不包含测试对象级别的效应,则可能忽略
与市场细分相关的重要信息。
查找最优特征
下一步,您需要使用 “效用刻画器”探索结果并找出特性的最优设置。
1. 点击 “选择模型”红色小三角菜单并选择效用刻画器。
该刻画器下方的 “对象项”菜单指示它显示的是女性的结果。
2. 点击 “效用刻画器”旁边的红色小三角,然后选择最优化和意愿 > 意愿函数。
114 选择模型 第 7章
“选择”平台的示例 消费者研究
图 7.9 具有意愿函数的效用刻画器
图 7.10 具有针对女性的最优设置的效用刻画器
针对女性的最优设置如下:薄馅饼皮、马苏里拉奶酪且无馅料。
4. 从 “对象项”菜单中,选择 M。
第7章 选择模型 115
消费者研究 启动 “选择”平台
图 7.11 性别设置为男性的效用刻画器
针对男性的最优设置如下:厚馅饼皮、马苏里拉奶酪加意大利辣香肠馅料。
在本例中,了解由性别确定的细分市场的偏好,这样您就可以提供两种比萨饼选择来满足两类
客户的需求。
启动 “选择”平台
通过选择分析 > 消费者研究 > 选择启动 “选择”平台。
“选择”平台的数据可组合到一个数据表中,也可分别位于两个或三个不同数据表中。打开“选
择”窗口后,第一个菜单项会让您指定 “数据格式”。
一个表,堆叠
对于这种格式,数据组合到单个数据表中。为测试对象提供的每一个特征都对应一行,并且有
一个指示符指示是否选择了该特征。
有关单表格式中的数据的示例,请参见第 107 页的 ““无选择”的单表格式”。有关详细信息,
请参见第 116 页的 “针对 “一个表,堆叠”的启动窗口”。
多个表,交叉引用
对于这种格式,数据存储到两个或三个不同表中:特征数据表和响应数据表是必需的,对象数
据表是可选的。“选择”启动窗口包含三个部分,每个部分对应不同的数据表。您可以根据需要
展开或折叠启动窗口的每个部分。
有关多表格式中的数据的示例,请参见第 110 页的“多表格式”。有关详细信息,请参见第 117
页的 “针对 “多个表,交叉引用”的启动窗口”。
116 选择模型 第 7章
启动 “选择”平台 消费者研究
针对 “一个表,堆叠”的启动窗口
图 7.12 针对 “一个表,堆叠”数据格式的启动窗口
针对 “多个表,交叉引用”的启动窗口
图 7.13 针对 “多个表,交叉引用”数据格式的启动窗口
特征数据
特征数据表描述的是与每个选择关联的特性。在数据表中,每个特性列定义一列。每个特征对
应一行。同时每个特征在表中有一列唯一的标识符。图 7.14 显示 Pizza Profiles.jmp 数据表和完
成的 “特征数据”面板。
响应数据
响应数据表包含一个测试对象标识符列、列出每个选择集内特征的特征标识符的列,还有一列
包含偏好特征标识符。每个测试对象和选择集都对应一行。当数据包含不止一组选择集时,可
使用分组变量来区分各个选择集。图 7.15 显示 Pizza Responses.jmp 数据表和完成的“响应数
据”面板。
当数据中包含多个组时,分组变量可用于对选择指标进行分组匹配。
120 选择模型 第 7章
启动 “选择”平台 消费者研究
依据 一列,其水平定义不同的分析。对于指定列的每个水平,相应行将作为针对单独表的单
独分析进行分析。结果显示在单独报表中。若分配了多个 “依据”变量,则为 “依据”变
量水平的每个可能组合生成单独分析。
响应者可以选择 “无”或 “无选择” 在 模 型 中 为 包 含 缺 失 值 的 响 应 行 输 入 “无 选 择 指 示
符”。对于 “多个表,交叉引用”数据格式,“无选择”行必须在响应数据表的 “已选择的
特征 ID”列中包含 (分类)缺失值。该选项显示在 “响应数据”面板的底部。
对象数据
对象数据表是可选的,这取决于您是否要对对象效应建模。该表中有一列包含在响应表中使用
的测试对象标识符,还有若干列包含测试对象的特性或特征。您可以将对象数据放入响应数据
表,但您应在 “对象数据”分级显示项中指定对象效应。图 7.16 显示 Pizza Subjects.jmp 数据
表和完成的 “测试对象数据”面板。
“选择模型”报表
除非在启动窗口中选定了 “分层 Bayes”,否则 “选择模型”报表包含以下信息:
• 第 122 页的 “效应汇总”
• 第 123 页的 “参数估计值”
• 第 123 页的 “似然比检验”
注意:仅当数据集较小,足以在合理时间内完成计算的情况下,才默认显示 “效应汇总”报表
和 “似然比检验”报表。若这些报表不显示,从红色小三角菜单中选择 “似然比检验”可显示
这两个报表。
效应汇总
若您的模型包含不止一个效应而且可以快速计算效应,则显示 “效应汇总”报表。(若该报表
不显示,请从红色小三角菜单中选择“似然比检验”,同时显示这两个报表。)该报表列出模型
估计的效应,并提供这些效应的 LogWorth (或 FDR LogWorth)值的图。该报表还提供一些
控件,这些控件可支持您在模型中添加或删除效应。模型拟合报表会根据在 “效应汇总”报表
中做的更改自动更新。详细信息,请参见 《拟合线性模型》手册的 “标准最小二乘法报表和选
项”一章中的 “效应汇总报表”一节。
在启动窗口中选中 “Bayes 对象效应”后,“效应汇总”报表不显示。这是因为在这种情况下不
执行似然比检验。
“效应汇总”表列
“效应汇总”表包含以下列:
源 列出按 p 值升序排序的模型效应。
LogWorth 显示每个模型效应的 LogWorth,定义为 -log10(p 值)。这种变换调整 p 值以提供
适合的绘图尺度。大于 2 的值在 0.01 水平下显著 (因为 – log 10 ( 0.01 ) = 2 )。
FDR LogWorth 显示每个模型效应的假发现率 LogWorth,定义为 -log10 (FDR P 值)。这是
用 于 绘 制 和 评 估 显 著 性 的 最 佳 统 计 量。选 中 FDR 复 选 框 可 用 FDR LogWorth 列 替 换
LogWorth 列。
条形图 显示 LogWorth(或 FDR LogWorth)值的条形图。该图在整数值处显示垂直虚线,在
2 处显示蓝色参考线。
P值 显示每个模型效应的 p 值。这是与“似然比检验”报表中显示的显著性检验对应的 p 值。
第7章 选择模型 123
消费者研究 “选择模型”报表
“效应汇总”表选项
汇总表下的选项支持您添加和删除效应:
删除 从模型中删除选定的效应。要删除一个或多个效应,请选择与效应对应的行并点击 “删
除”按钮。
添加特征效应 打开一个面板,其中包含针对 “一个表,堆叠”数据格式的数据表中所有列的
列表,以及针对 “多个表,交叉引用”数据格式的特征数据表中的列的列表。选择您要添
加到模型中的列,然后点击列选择列表下的“添加”将这些列添加到模型中。点击“关闭”
关闭该面板。
添加对象效应 打开一个面板,其中包含针对 “一个表,堆叠”数据格式的数据表中所有列的
列表,以及针对 “多个表,交叉引用”数据格式的对象数据表中的列的列表。选择您要添
加到模型中的列,然后点击列选择列表下的“添加”将这些列添加到模型中。点击“关闭”
关闭该面板。
参数估计值
“参数估计值”报表提供与 “项”列中所列的效应关联的效用系数的估计值和标准误差。与特
性关联的系数有时称为成分效用值。在启动窗口中选定 “Firth 偏倚调整估计值”选项后,参数
估计值基于 Firth 修正偏倚的最大似然估计量。这些估计值要比没有修正偏倚的 MLE 更准确。
有关效用的详细信息,请参见第 155 页的 “效用和概率”。
比较准则
以下拟合统计量显示在报表中并可用来比较模型:AICc (校正的 Akaike 信息准则) 、 BIC
(Bayes 信息准则)、 − 2* 对数似然和 − 2*Firth 对数似然。有关详细信息和公式,请参见 《拟
合线性模型》手册的 “统计详细信息”附录中的 “似然、 AICc 和 BIC”一节。
在启动窗口中选定 “Firth 偏倚调整估计值”选项时,报表中将包含 − 2*Firth 对数似然拟合统
计量。请注意,默认选中该选项。使用或不使用 Firth 偏倚调整估计值不会影响 AICc 得分或
− 2* 对数似然结果。
注意:对于上述每一个统计量,较小的值指示较好的拟合。
似然比检验
若模型在 5 秒内拟合,则默认显示“似然比检验”报表。若该报表不显示,可以从“选择模型”
红色小三角菜单中选择 “似然比检验”选项。该报表提供以下信息:
124 选择模型 第 7章
“选择模型”报表 消费者研究
源 列出模型中的效应。
似然比卡方 针对相应效应检验的似然比卡方统计量的值。
自由度 卡方检验的自由度。
概率 > 卡方 卡方检验的 p 值。
条形图 显示似然比卡方值的条形图。
Bayes 参数估计值
项 模型项。
后验均值 项系数的参数估计值。对于老化期之后的每次迭代,计算特定于测试对象的系数估
计值的均值。后验均值是这些均值的平均值。
后验标准差 老化过程后经过几次迭代,特定于测试对象的估计值的均值的标准差。
对象标准差 特定于测试对象的估计值的标准差。
第7章 选择模型 125
消费者研究 “选择”平台选项
提示:选择红色小三角选项 “保存对象估计值”以查看单个估计值。
迭代总次数 执行的迭代总次数,包括老化期。
老化迭代次数 老化迭代次数。该次数等于启动窗口中指定的 “Bayes 迭代数”的一半。
响应者数目 测试对象数。
老化后的平均对数似然 基于在老化期后获取的值计算的对数似然函数的平均值。
“选择”平台选项
“选择建模”平台提供了很多选项。要访问这些选项,请选择 “选择模型”红色小三角菜单。
图 7.18 边缘效应的示例
图 7.19 “效用比较”窗口
第7章 选择模型 127
消费者研究 “选择”平台选项
支付意愿 要求数据表包含连续的价格列。对于新特征设置,计算价格必须变动多少才能生成
相同的预测输出结果。使用针对每个背景设置的基线设置计算结果。
保存效用公式 创建包含用于效用的公式列的新数据表。新数据表包含与每个测试对象和特征
的组合一一对应的行以及针对特征和对象效应的列。
按对象保存梯度 构建一个新表,其中包含每个测试对象各参数的平均 (Hessian 比例梯度)
步长,每个测试对象对应一行。这对应于使用 Lagrangian 乘数检验将该对象与其余对象分
离。以后可以使用内置脚本对这些值聚类,以指示数据中表示的独特市场细分。有关更多
详细信息,请参见第 155 页的 “梯度”。相关示例,请参见第 138 页的 “细分示例”。
保存对象估计值 (仅在选定 “分层 Bayes”时可用。)创建一个表,其中每行都包含每个
效应的特定于测试对象的参数估计值。特定于测试对象的参数效应的分布以 “Bayes 参数
估计值”报表中给定项的估计值为中心。“对象接受率”提供 Metropolis-Hastings 步骤期
间得到新参数估计值的接受率。通常,接受率 0.20 被视为良好。请参见第 124 页的“Bayes
参数估计值”。
保存 Bayes 链 (仅在选定 “分层 Bayes”时可用。) 创建一个表,其中提供关于计算特
定于测试对象的 Bayes 估计时使用的迭代链的信息。请参见第 129 页的“保存 Bayes 链”。
模型对话框 显示 “选择”启动窗口,可以使用该窗口来修改和重新拟合模型。您可以指定新
数据集、新 ID 和新模型效应。
请参见 《使用 JMP》手册中的 “JMP 报表”一章,获取有关下列选项的信息:
本地数据过滤器 显示或隐藏本地数据过滤器,该过滤器使您可以过滤特定报表中使用的数据。
恢复 包含使您可以重复运行分析或重新启动分析的选项。在支持该功能的平台中,“自动重新
计算”选项可将您对数据表所做的更改立即体现在相应的报表窗口中。
保存脚本 包含使您可以保存脚本的选项,该脚本可在多个指定位置重新生成报表。
保存 “依据”组脚本 包含使您可以保存脚本的选项,该脚本可在多个指定位置为 “依据”变
量的所有水平重新生成平台报表。仅当在启动窗口中指定 “依据”变量时才可用。
支付意愿
支付意愿一词是指客户愿意为新功能支付的价格,计算该价格以匹配客户的基准功能效用。例
如,假定客户愿意为配有 40 GB 硬盘驱动器的计算机支付 $1,000。通过将硬盘驱动器功能设置
为 80 GB,再求解提供与 $1000 40 GB 硬盘驱动器相同效用的价格,即可计算 80 GB 硬盘驱动器
的支付意愿。
“支付意愿”启动窗口选项
基线 每个因子的基线设置。若因子为分类因子,则从列表中选择基线值。若因子为数值因子,
则输入基线值。
角色 因子的类型。您可以从下面的列表中选择:
特征因子 实验中您想要定价的产品或服务功能。
价格因子 实验中的价格因子。价格因子必须为连续型,而且对于每个支付意愿分析都只能
指定一个价格因子。
背景常数 您希望在支付意愿计算中保持不变的一个因子。通常,它们是特定于测试对象的
变量。
背景变量 针对该变量的每个因子水平,您希望在支付意愿的计算保持不变。通常,它们是
测试对象级别的因子。将测试对象因子指定为背景变量而不是背景常数,这样可为所有
变量水平提供支付意愿估计值。
在报表表中包括基线设置 向 “支付意愿”报表添加价格变化为零的基线设置。
提示:若生成输出表,使用该选项可显示所有基线设置和特性设置。
图 7.20 “支付意愿”启动窗口
一旦完成首次支付意愿计算,该平台会记住您选定的基线值和指定的角色。这样您就可以进行
多次支付意愿比较,而不必重新输入基线信息。若没有称为 “价格”的因子,但在分析中使用
了连续因子,则将该连续因子自动指定为 “支付意愿”窗口中的 “价格”因子。常见的传统意
义上的成本变量 (非价格)包括差旅时间或距离等。
第7章 选择模型 129
消费者研究 其他示例
“支付意愿”报表
“支付意愿”报表显示每个因子的基线值以及基线效用值。对于每个因子,该报表都显示特征设
置、估计的价格变化和新价格。若没有交互作用或二阶效应,则还会显示标准误差和置信区间。
使用 delta 方法计算这些统计量。
图 7.21 “支付意愿”报表
保存 Bayes 链
其他示例
本节包括下列示例:
• 第 130 页的 “示例:做出设计决策”
• 第 138 页的 “细分示例”
• 第 142 页的 “使用 “选择”平台进行 Logistic 回归的示例”
130 选择模型 第 7章
其他示例 消费者研究
示例:做出设计决策
您可以使用 “选择建模”平台来确定产品特性的相对重要性。即使对于特定的产品来讲,我们
知道哪些特性对于消费者来讲是重要的,而有关这些特性的偏好取舍的信息也可能是未知的。
通过获取这些信息,市场研究人员或产品设计者可以在考虑消费者偏好的同时,权衡产品的不
同特性,从而得到最优的产品。本例演示了该方法在产品设计上的优势。
已知对于笔记本电脑设计很重要的四个特性:硬盘大小、处理器速度、电池寿命和销售价格。接
下来的示例用已经收集好的数据来确定四个笔记本电脑特性中(硬盘、速度、电池寿命和价格)
哪一个是最重要的。同时我们还将通过该示例评估是否有性别或职位效应与这些特性相关。
本例包含以下各节:
• 第 130 页的 “完成启动窗口”
• 第 133 页的 “分析模型”
• 第 134 页的 “与基线比较”
• 第 136 页的 “多项选择的比较”
完成启动窗口
注意:若您不想执行本节中的手动步骤,请点击脚本选择 - 性别旁边的绿色小三角运行该模型,
然后转至第 133 页的 “分析模型”。
2. 点击打开特征表和对象表脚本旁边的绿色小三角。
该脚本可打开 Laptop Profile.jmp 和 Laptop Subjects.jmp 数据表。
3. 选择分析 > 消费者研究 > 选择。
注意:可以从三个打开的数据表中的任一个执行该操作。
4. 从 “数据格式”列表中,选择多个表,交叉引用。
5. 点击“特征数据”下的选择数据表,然后选择 Laptop Profile.jmp。选择选择 ID 并点击特征 ID。
6. 选择硬盘、速度、电池寿命和价格,然后点击添加。
7. 选择调查和选择集,然后点击分组。
第7章 选择模型 131
消费者研究 其他示例
8. 打开响应数据分级显示项。
9. 从选择数据表列表中,选择 Laptop Runs.jmp。
10. 按如下所示完成响应数据表:
‒ 选择响应,然后点击已选择的特征 ID。
‒ 选择选择 1 和选择 2,然后点击特征 ID 选择。
‒ 选择调查和选择集,然后点击分组。
‒ 选择人员,然后点击对象 ID。“响应数据”窗口显示在图 7.23 中。
132 选择模型 第 7章
其他示例 消费者研究
11. 打开对象数据分级显示项。
12. 从选择数据表列表中,选择 Laptop Subjects.jmp。
13. 选择人员,然后点击对象 ID。
14. 选择性别并点击添加。
“对象数据”窗口显示在图 7.24 中。
分析模型
1. 点击运行模型。
图 7.25 笔记本电脑效应汇总
图 7.26 笔记本电脑结果
134 选择模型 第 7章
其他示例 消费者研究
图 7.27 针对女性的笔记本电脑刻画器结果
4. 从 “对象项”旁边的列表中,选择男性。
图 7.28 开发过程中针对男性的笔记本电脑刻画器结果
与基线比较
假定您正在开发一种新产品。您想要知道相对于老产品或竞争对手的产品,客户更倾向于选择
该新产品的可能性。使用 “概率刻画器”将特征与基线特征作比较。
在该示例中,您的公司当前正在生产的笔记本电脑规格为:40 GB 硬盘,1.5 GHz 处理器,电池
寿命为 6 小时,价格为 1,000 美元。您想通过尽可能少地调整产品特性来改进产品使其更受客户
第7章 选择模型 135
消费者研究 其他示例
图 7.29 带有 “价格”文本输入区的概率刻画器
该配置的概率为 0.5。
5. 在 “概率刻画器”中,移动硬盘滑块至 80 GB。
请注意,进行这种更改后,价格增长对选择概率的影响相对不那么敏感了。
6. 点击刻画器中的价格单元格上方的 $1000 标签,键入 $1,200,然后在文本框外点击。
136 选择模型 第 7章
其他示例 消费者研究
图 7.30 考虑基准产品效应的笔记本电脑的概率刻画器结果
多项选择的比较
使用 “多项选择刻画器”比较产品特征。
• 您当前在生产一种低端笔记本电脑,它的硬盘小、处理器慢且电池寿命短。定价为 $1000。
• A 公司生产的产品具有处理器速度快、电池寿命长且价格 ($1200) 合理等特性。
• B 公司生产的产品硬盘空间最大、速度最快、但是价格高 ($1500) 且电池寿命短。
您想通过提高某一方面的性能并提升价格来赢得市场份额。
1. 执行以下操作之一:
‒ 执行第 130 页的 “完成启动窗口”中的步骤。然后完成第 133 页的 “分析模型”中的第
1 步 和第 2 步。
‒ 在 Laptop Runs.jmp 样本数据表中,点击选择简化模型脚本旁边的绿色小三角。
2. 点击 “选择模型”红色小三角菜单并选择多项选择刻画器。
将显示一个窗口,询问要刻画的备择选择数。接受默认数字 3。
3. 点击确定。
将显示三个备择刻画器。请注意,刻画器设置为 “性别 = 女性”。
每个刻画器中因子都设置为其默认值。备择 1 表示您要开发的产品。备择 2 表示 A 公司的产
品。备择 3 表示 B 公司的产品。
4. 对于备择 1,将硬盘设置为 40 GB,速度设置为 1.5 GHz,电池寿命设置为 4 小时,价格设
置为 1,000 美元。
5. 对于备择 2,将硬盘设置为 40 GB,速度设置为 2.0 GHz,电池寿命设置为 6 小时,价格设
置为 1,200 美元。
第7章 选择模型 137
消费者研究 其他示例
通过增加硬盘空间,同时提高笔记本电脑的价格,预计您公司可以获得的女性市场份额约为
43%。该份额超过了 B 公司高性能笔记本电脑的份额,远远高于图 7.31 中所示的初始低端设
置下的市场份额。
探索可增加男性市场份额的设置。若同时提高 “硬盘”大小和 “速度”,您可以获得男性市
场份额中的 44%。
细分示例
在本例中,您尝试确定不同比萨饼偏好的细分市场。
要查看如何完成本示例的启动窗口,请参见示例第 110 页的 “多表格式”中的第 1 步 到第 15
步。否则,遵照以下说明操作。
定义聚类
1. 选择帮助 > 样本数据库,然后打开 Pizza Responses.jmp。
2. 点击选择脚本旁边的绿色小三角。
3. 点击 “选择模型”红色小三角菜单中,然后选择按对象保存梯度。
将显示一个数据表,其中包含为每个主效应和测试对象的交互作用保存的梯度力。
4. 点击层次聚类脚本旁边的绿色小三角。
图 7.34 比萨饼数据的测试对象聚类的系统树图
该脚本针对梯度表中除对象之外的所有列运行层次聚类分析。点击两个菱形中的任一个,可
以看到这些行已分成三个聚类。
5. 点击 “层次聚类”旁边的红色小三角,然后选择保存聚类。
名为聚类的新列将添加到包含梯度的数据表中。为每个测试对象指定了一个聚类值,该类的
所有测试对象都具有相似梯度力。有关其他“层次聚类”选项的讨论,请参见《多元方法》
手册中的 “层次聚类”平台一章。
您可以删除梯度列,因为它们仅用于获取聚类。
6. 选择除了试尝者和聚类之外的其他所有列。右击所选列,然后选择删除列。
7. 点击重新合并数据脚本旁边的绿色小三角 (图 7.33)。
聚类信息合并到对象数据表中。对象数据表中的列现在为试尝者、性别和聚类,如图 7.35 中
所示。
140 选择模型 第 7章
其他示例 消费者研究
图 7.35 具有聚类列的对象数据
该表现在可以用于进一步分析。
探索聚类
1. 点击列面板中聚类变量左侧的图标,然后选择有序型。
2. 选择分析 > 以 X 拟合 Y。
3. 选择性别,然后点击 Y,响应。
4. 选择聚类,然后点击 X,因子。
5. 点击确定。
第7章 选择模型 141
消费者研究 其他示例
您会看到以下内容:
‒ 聚类 1 在男性和女性之间平分
‒ 聚类 2 仅包含女性
‒ 聚类 3 仅包含男性
若需要,您现在可以通过添加聚类变量来重新拟合并分析该模型。
142 选择模型 第 7章
其他示例 消费者研究
使用 “选择”平台
1. 选择帮助 > 样本数据库,然后打开 Lung Cancer Responses.jmp。
请注意该数据表只有一列 (肺癌)和两行 (Cancer 和 NoCancer)。
2. 选择分析 > 消费者研究 > 选择。
3. 从 “数据格式”旁边的列表中,选择多个表,交叉引用。
4. 点击选择数据表,选择 Lung Cancer Responses.jmp,然后点击确定。
5. 选择肺癌,然后点击特征 ID。
6. 选择肺癌,然后点击添加。
7. 取消选中 “Firth 偏倚调整估计值”框。
8. 打开响应数据分级显示项。
9. 点击选择数据表,选择 Lung Cancer Choice.jmp,然后点击确定。
10. 执行以下操作:
‒ 选择肺癌,然后点击已选择的特征 ID。
‒ 选择选择 1 和选择 2,然后点击特征 ID 选择。
‒ 选择计数并点击频数。
第7章 选择模型 143
消费者研究 其他示例
11. 打开对象数据分级显示项。
12. 点击选择数据表,选择 Lung Cancer Choice.jmp,然后点击确定。
13. 选择吸烟者并点击添加。
14. 点击运行模型。
144 选择模型 第 7章
其他示例 消费者研究
使用 “拟合模型”平台。
1. 选择帮助 > 样本数据库,然后打开 Lung Cancer.jmp。
2. 选择分析 > 拟合模型。
由于数据表包含一个模型脚本,“模型规格”窗口将自动完成。名义型 Logistic 特质已被选定。
3. 点击运行。
将数据转换为两个分析表的示例
考虑来自 Daganzo 的数据,数据表为 Daganzo Trip.jmp。该数据集包含分别采用三种不同交通
方式的旅行时间和每个测试对象的首选交通方式。
添加选择模式和测试对象
1. 选择帮助 > 样本数据库,然后打开 Daganzo Trip.jmp 数据表。
该数据集的部分内容显示在图 7.43 中。
第7章 选择模型 147
消费者研究 其他示例
列出的每个选择编号必须首先转换为相应的旅行模式名称。通过使用公式编辑器中的
Choose 函数可以轻松进行转换,具体如下所示。
2. 选择列 > 新建列。
3. 指定列名为选择模式,指定建模类型为名义型。
4. 点击列属性,然后选择公式。
5. 在函数列表中点击条件,选择 Choose,然后按逗号键两次以获取该函数的额外参数。
6. 为 Choose 表达式 (expr) 点击选择,然后双击每个子句输入框依次输入 “地铁”、“公共汽
车”和 “小汽车”(带引号),如图 7.44 中所示。
7. 在 “公式编辑器”窗口中点击确定。
8. 在 “新建列”窗口中点击确定。
新生成的选择模式列显示在数据表中。因为每行包含的数据为每个测试对象所做的选择,应
创建一列序列数据来标识测试对象。
9. 选择列 > 新建列。
10. 指定 “列名”为测试对象。
11. 点击 “初始化数据”旁边的缺失 / 空,然后选择序列数据。
12. 点击确定。
修改后的表的部分内容显示在图 7.45 中。
148 选择模型 第 7章
其他示例 消费者研究
堆叠数据
为了构造特征数据,每个备择选择需要在单独的行中表示。
1. 选择表 > 堆叠。
2. 选择地铁、公共汽车和小汽车,然后点击堆叠列。
3. 对于输出表名称,键入 Stacked Daganzo。为 “堆叠数据列”键入旅行时间,为 “源标签
列”键入模式。
输入完成后的堆叠窗口显示在图 7.46 中。
4. 点击确定。
生成表的部分视图显示在图 7.47 中。
第7章 选择模型 149
消费者研究 其他示例
创建特征数据表
对于特征数据表,您需要测试对象、模式和旅行时间列。
1. 选择测试对象、模式和旅行时间列,然后选择表 > 子集。
2. 选择所有行和选定列,然后点击确定。
生成的数据表的部分内容显示在图 7.48 中。请注意默认表名称为“‘Stacked Daganzo’的
子集”。
创建响应数据表
对于响应数据表,您需要测试对象和选择模式列,同时还需要一列对应于每个可能的选择。
3. 打开 Daganzo Trip.jmp 数据表后,选择对象和选择模式列。
4. 选择表 > 子集。
5. 选择所有行和选定列,然后点击确定。
请注意默认表名称为 “‘Daganzo Trip’的子集”。
6. 选择列 > 新建列。
7. 对于列前缀,键入选择。
8. 选择字符和名义型。
9. 在 “要添加的列数”旁边键入 3。
10. 点击确定。
数据表中添加了选择 1、选择 2 和选择 3 列。
11. 在选择 1 的第一行中键入“公共汽车”(不带引号)。右击该单元格并选择填充 > 填充至表末。
150 选择模型 第 7章
其他示例 消费者研究
拟合模型
现在您将原始 Daganzo Trip.jmp 表分为了两个单独的表,可以运行 “选择”平台了。
1. 选择分析 > 消费者研究 > 选择。
2. 从 “数据格式”列表中,选择多个表,交叉引用。
3. 指定模型,如图 7.50 中所示。
第7章 选择模型 151
消费者研究 其他示例
4. 点击运行模型。
生成的参数估计值表示旅行时间的效用系数,显示在图 7.51 中。
152 选择模型 第 7章
其他示例 消费者研究
负的系数意味着旅行时间的增加对于消费者效用或满意度有负面影响。似然比检验结果表明包
含 “旅行时间”效应的 “选择”模型是显著的。
将数据转换为一个分析表的示例
无需创建两个或三个表,从更加切合实际的角度考虑,可以将数据转换成一个表。对于单表格
式,按之前的示例那样添加对象效应。我们需要添加一个响应指示符列,而非生成三个不同列
来表示选择集 (选择 1、选择 2、选择 3)。单表转换包括以下步骤。
1. 通过第 146 页的 “将数据转换为两个分析表的示例”中所示的 “堆叠数据”步骤创建或打
开 Stacked Daganzo.jmp。
2. 选择列 > 新建列。
3. 键入响应作为列名。
4. 点击列属性,然后选择公式。
5. 在函数列表中选择条件,然后选择 If。
6. 为表达式 (expr) 选择列选择模式。
7. 输入 “=”并选择模式。
8. 为 Then 子句键入 1,为 Else 子句键入 0。
9. 在 “公式编辑器”窗口中点击确定。在 “新建列”窗口中点击确定。
完成的公式应类似于图 7.52。
11. 选择所有行和选定列,然后点击确定。
新数据表的部分内容显示在图 7.53 中。
13. 点击运行模型。
154 选择模型 第 7章
技术细节 消费者研究
技术细节
本节包含有关以下主题的信息:
• 第 154 页的 “特殊数据表规则”
• 第 155 页的 “效用和概率”
• 第 155 页的 “梯度”
特殊数据表规则
默认选择集
若在每次试验中,您可以选择任意响应特征,则可以忽略特征 ID 选择项,它位于 “选择”启动
窗口的 “响应数据”部分中的选择角色变量下。“选择模型”平台会假定每次的试验都包含所
有选择特征。
具有响应数据的对象数据
若您在响应数据表中包含对象数据,请在 “对象数据”下选择该表为选择数据表。在这种情况
下,不需要指定对象 ID 列,实际上不使用它。通常假定对象数据在每个对象的多次试验中以一
致方式重复。
Logistic 回归
效用和概率
通过 “选择”模型的参数估计值我们能够获得消费者效用或线性效用函数中的边缘效用。效用
反映了消费者对具有特定特性的产品的满意度水平,由模型的参数估计值确定。
选择模型的统计公式可表示如下:
用 X[k] 表示一个具有截距的对象特性设计行。
用 Z[j] 表示一个没有截距的选择特性设计行。
则第 k 个对象相对 m 个选择中的第 j 个选择做出给定选择的概率为:
exp ( β' ( X [ k ] ⊗ Z [ j ] ) )
P i [ jk ] = -------------------------------------------------------------------
m
exp ( β' ( X [ k ] ⊗ Z [ l ] ) )
l=1
其中:
‒ ⊗ 是 Kronecker 逐行乘积
‒ 分子用于计算实际选择的第 j 个备选
‒ 分母对提供给该测试对象的 m 个选择求和
梯度
在选择 “按对象保存梯度”选项后,您所获得的梯度值是优化过程中用于生成估计值的按测试
对象聚合的 Newton-Raphson 步长。在估计中,总梯度为零, Δ = H-1g = 0,其中 g 是最大似然
估计中的对数似然函数的总梯度, H-1 是 Hessian 函数的反函数或对数似然函数的二阶偏导数
负数的反函数。
但是,取消聚合 Δ 将生成以下结果:
Δ = ΣijΔij = ΣH-1gij = 0,
156 选择模型 第 7章
技术细节 消费者研究
Δ ij
Δ i = Σ j ------- ,
n i
MaxDiff(最大化差异度量)可用于替代标准偏好尺度来确定被评测项的相对重要性。MaxDiff
强制响应者报告其最偏好和最不偏好的选项。这样生成的排序往往比使用标准偏好尺度生成的
排名更为明确。
MaxDiff 平台支持您执行以下操作:
• 使用有关测试对象特点以及产品特性的信息。
• 整合来自一个、两个或三个源的数据。
• 提供基于测试对象级别的得分以用于对数据的细分或聚类。
• 使用 Bayes 方法估计特定于测试对象的系数。
• 使用修正偏倚的最大似然估计量 (Firth, 1993)。
“MaxDiff 建模”平台概述
MaxDiff 亦称最优最差缩放 (BWS),是基于选择的测量方法。 MaxDiff 要求响应者报告最优和
最差选择,而不要求响应者从若干备选特征中报告最优选择。相对于响应者仅报告一个最优选
择的方法, MaxDiff 方法可以提供关于偏好的更多信息。有关 MaxDiff 研究课题的背景信息,
请参见 Louviere et al. (2015)。有关选择建模的背景信息,请参见 Louviere et al. (2015)、 Train
(2009) 和 Rossi et al. (2006)。
MaxDiff 分析使用随机效用理论框架。假定某一选择对响应者存在基本价值或效用。MaxDiff 平
台估计这些效用,除此之外还估计相对于其他选择更偏好某一选择的概率。上述估计需要使用
条件 Logistic 回归来完成。请参见 McFadden (1974)。
市场研究人员有时想分别分析不同测试对象的偏好结构,以查看是否存在不同表现行为的群
体。若有足够的数据,可以在 “响应数据”中指定 “依据组”,或者您还可以引入测试对象标
识符作为测试对象级的模型项。不过若测试对象人数很多的话,此方法的成本会很高。文献中
讨论的其他细分方法包括 Bayesian 和混合法。
若没有足够数据指定 “依据组” ,则可以使用响应数据和按对象保存梯度选项对测试对象进行
聚类的方法在 JMP 中进行细分。该选项创建一个新数据表,其中包含每个测试对象各参数的平
均 Hessian 比例梯度。相关示例,请参见 “选择模型”章中第 138 页的 “细分示例”。有关梯
度值的详细信息,请参见 “选择模型”章中第 155 页的 “梯度”。
MaxDiff 还提供分层 Bayes 方法来估计测试对象级别的效应。该方法适用于市场细分。
MaxDiff 平台的示例
有 30 位响应者参加了 MaxDiff 研究,目的在于比较七种不同口味的薯片。每个选择集都包含三
种特征 (薯片口味)。对于每个选择集,响应者的最优选择记录为 1,其最差选择记录为 -1。中
间选择记录为 0。
MaxDiff 平台可以分析以单表格式或多表格式呈现的数据。在多表格式中,关于响应、选择集
和测试对象的信息保存在不同的数据表中。在单表格式中,该信息包含在单个数据表中。
• 第 159 页的“单表格式”显示如何分析采用单表格式的一部分可用数据。请注意,您可以向
单个表添加其他特征和对象数据,以便执行更全面的分析。
• 第 161 页的 “多表格式”显示如何将不同表中的信息集中到一个 MaxDiff 分析中。
第8章 MaxDiff 159
消费者研究 MaxDiff 平台的示例
单表格式
1. 选择帮助 > 样本数据库,然后打开 Potato Chip Combined.jmp。
2. 选择分析 > 消费者研究 > MaxDiff。
请注意,默认数据格式设置为 “一个表,堆叠”。
3. 点击选择数据表。
4. 选择 Potato Chip Combined,然后点击确定。
5. 按如下方式为列分配角色。完成的启动对话框如图 8.2 所示。
‒ 选择响应,然后点击响应指示符。
‒ 选择响应者,然后点击对象 ID。
‒ 选择选择集 ID,然后点击选择集 ID。
‒ 选择特征 ID,然后在 “构造特征效应”面板中点击添加。
图 8.4 “所有比较”报表
第8章 MaxDiff 161
消费者研究 MaxDiff 平台的示例
每一项比较都是在标记行的薯片类型与标记列的薯片类型之间的估计效用差异。较小 p 值的
颜色为深蓝或红色,具体取决于差异符号。例如,根据横贯 Gyro 行的蓝色,您可以看到
Gyro 薯片的效用显著低于其他所有薯片类型。Barbecue 薯片的效用比其他所有薯片类型都
高,尽管与 Southern Barbecue 薯片的差别不大。
多表格式
这一版本的薯片研究使用三个数据表:Potato Chip Profiles.jmp、 Potato Chip Responses.jmp
和 Potato Chip Subjects.jmp。尽管您总是可将数据整合到单个表中,但若您想要在分析中加入
其他特征和测试对象变量,多表方法比单表分析更为方便。
完成启动窗口
2. 点击打开特征表和对象表脚本旁边的绿色小三角。
‒ 特征数据表 Potato Chip Profiles.jmp 列出研究中的所有薯片类型(口味)以及关于原产
地的信息 (产地)。每个选择都具有一个特征 ID。
‒ 对象数据表 Potato Chip Subjects.jmp 列出响应者。其中还提供关于每个响应者的其他
信息:国籍和性别。
‒ 响应数据表 Potato Chip Responses.jmp 列出响应者。对于每个响应者,列出每组特征
的调查 ID 和选择集 ID,以及每个选择集的特征 ID 值。该表还包含最佳特征列和最差特
征列中的响应数据。
3. 从以上三个数据表中的任意表中选择分析 > 消费者研究 > MaxDiff。
4. 从 “数据格式”列表中,选择 “多个表,交叉引用”。
共有三个不同的分级显示项,每个分级显示项对应一个数据源。
5. 在 “特征数据”下点击选择数据表。
将显示 “特征数据表”窗口,该窗口提示您指定特征数据所在的数据表。
6. 选择 Potato Chip Profiles.jmp,然后点击确定。
该表中的列显示在选择列中。
7. 从 “选择列”列表中选择特征 ID,然后点击选择角色变量下的特征 ID。
8. 选择口味,然后点击构造模型效应下的添加。
请注意,产地是您可以添加到效应列表的另一个特征效应。
162 MaxDiff 第8章
MaxDiff 平台的示例 消费者研究
图 8.5 完成 “特征数据”分级显示项
9. 打开 “响应数据”分级显示项。点击选择数据表。
10. 选择 Potato Chip Responses.jmp,然后点击确定。
11. 按如下方式为列分配角色。完成的启动对话框如图 8.6 所示。
‒ 选择最佳特征,然后点击最佳选择。
‒ 选择最差特征,然后点击最差选择。
‒ 选择选择 1、选择 2 和选择 3,然后点击特征 ID 选择。
‒ 选择响应者,然后点击对象 ID。
第8章 MaxDiff 163
消费者研究 MaxDiff 平台的示例
12. 打开 “对象数据”分级显示项。点击选择数据表。
13. 选择 Potato Chip Subjects.jmp,然后点击确定。
14. 选择响应者,然后点击对象 ID。
15. 选择国籍和性别,然后点击构造模型效应下的添加。
探索模型
1. 点击运行模型。
启动 MaxDiff 平台
通过选择分析 > 消费者研究 > MaxDiff 启动 MaxDiff 平台。
MaxDiff 平台的数据可组合到一个数据表中,也可分别位于两个或三个不同数据表中。当 “选
择”窗口打开时,从 “数据格式”列表中选择您要使用一个数据表还是多个数据表。
一个表,堆叠
对于这种格式,数据组合到单个数据表中,提供给测试对象的每个特征都对应一行,该特征中
的最佳和最差选择都有一个标识符。
有关单表格式中的数据的示例,请参见第 159 页的 “单表格式”。 详细信息,请参见第 165 页
的 “针对 “一个表,堆叠”的启动窗口”。
第8章 MaxDiff 165
消费者研究 启动 MaxDiff 平台
多个表,交叉引用
您的数据存储到两个或三个不同表中:特征数据表和响应数据表是必需的,对象数据表是可选
的。 MaxDiff 启动窗口包含三个部分,每个部分对应不同的数据表。您可以根据需要展开或折
叠 “选择”窗口的每个部分。
有关多表格式中的数据的示例,请参见第 161 页的 “多表格式”。 详细信息,请参见第 166 页
的 “针对 “多个表,交叉引用”的启动窗口”。
针对 “一个表,堆叠”的启动窗口
图 8.9 显示使用 Potato Chip Combined.jmp 填充的单表启动窗口。
图 8.9 针对 “一个表,堆叠”数据格式的启动窗口
构造特征效应 添加从特征的特性中构造的效应。
有关 “构造特征效应”面板的信息,请参见 《拟合线性模型》手册的 “模型规格”一章中
的 “构造模型效应”一节。
构造对象效应 (可选) 添加从测试对象相关因子构造的效应。
有关 “构造对象效应”面板的信息,请参见 《拟合线性模型》手册的 “模型规格”一章中
的 “构造模型效应”一节。
Firth 偏倚调整估计值 计算修正偏倚的 MLE 以获得更好的估计值和检验。这些估计值还可缓
解 Logistic 模 型 中常 见 的 分离 问 题。有 关 Logistic 回 归 中 的分 离 问题 的 讨 论,请 参考
Heinze and Schemper (2002)。
分层 Bayes 使用 Bayes 方法估计特定于测试对象的参数。请参见第 173 页的 “Bayes 参
数估计值”。
Bayes 迭代数 (仅在选定“分层 Bayes”时适用。)用来估计对象效应的自适应 Bayes 算
法的迭代总次数。该数字包括废弃的老化迭代期。老化迭代次数等于启动窗口中指定的
“Bayes 迭代数”的一半。
针对 “多个表,交叉引用”的启动窗口
图 8.10 显示多表启动窗口,其中使用 Potato Chip Profile.jmp 填充了“特征数据”分级显示项。
图 8.10 针对 “多个表,交叉引用”数据格式的启动窗口
若采用 “多个表,交叉引用”,启动窗口包含三个部分:
• 第 167 页的 “特征数据”
第8章 MaxDiff 167
消费者研究 启动 MaxDiff 平台
• 第 167 页的 “响应数据”
• 第 169 页的 “对象数据”
特征数据
特征数据表描述与每个选择关联的特性。每个选择可以包含很多不同的特性,每个特性通过数
据表中的一列来显示。每个可能的选择都对应一行,而且它们都有唯一的 ID。
选择数据表 选择或打开包含特征数据的数据表。选择 “其他”可打开当前尚未打开的文件。
特征 ID 每行选择组合的标识符。若特征 ID 列不能唯一标识特征数据表中的每行,您需要添加
分组列。添加分组列,直到分组和特征 ID 列的组合能够唯一标识该行或特征。
分组 一列,在该列与 “选择集 ID”列一同使用时,可唯一指定每个选择集。例如,若对于调
查 = A 特征 ID = 1,对于调查 = B 特征 ID = 1,则调查将作为分组列。
构造特征效应 添加从特征中的特性构造的效应。
有关 “构造特征效应”面板的信息,请参见 《拟合线性模型》手册的 “模型规格”一章中
的 “构造模型效应”一节。
Firth 偏倚调整估计值 计算与没有修正偏倚的 MLE 相比能够生成更好估计值和检验的修正偏
倚的 MLE。这些估计值还可缓解 Logistic 模型中常见的分离问题。有关 Logistic 回归中的
分离问题的讨论,请参考 Heinze and Schemper (2002)。
分层 Bayes 使用 Bayes 方法估计特定于测试对象的参数。请参见第 173 页的 “Bayes 参
数估计值”。
Bayes 迭代数 (仅在选定“分层 Bayes”时适用。)用来估计对象效应的自适应 Bayes 算
法的迭代总次数。该数字包括废弃的老化迭代期。老化迭代次数等于启动窗口中指定的
“Bayes 迭代数”的一半。
响应数据
图 8.11 “响应数据”分级显示项
响应数据表包含研究结果。其中提供了每个试验的选择集 ID,以及测试对象选定的最佳和最差
特征。响应数据通过选择集列和选择响应列链接到特征数据。当数据中包含多个组时,分组变
量可用于对选择指标进行分组匹配。
选择数据表 选择或打开包含特征数据的数据表。选择 “其他”可打开当前尚未打开的文件。
最佳选择 “响应”表列,其中包含测试对象指定为 “最佳”特征的特征 ID。
最差选择 “响应”表列,其中包含测试对象指定为 “最差”特征的特征 ID。
特征 ID 选择 对于每个选择集,包含可能选择集的特征 ID 的列。
分组 一列,在该列与已选择的特征 ID 列一同使用时,可唯一指定每个选择集。
对象 ID 用于研究参与者的唯一标识符。
频数 包含频数的列。若 n 是给定行的频数变量的值,则该行在计算中使用 n 次。若它小于 1
或缺失,则 JMP 不使用它来计算任何分析。
权重 包含数据表中每个观测的权重值的列。仅当权重值大于零时才在分析中包含该权重。
依据 指定单独分析列。对于指定列的每个水平,相应行将作为针对单独表的单独分析进行分
析。结果显示在不同的报表中。若分配了多个 “依据”变量,则为 “依据”变量水平的每
个可能组合生成单独报表。
第8章 MaxDiff 169
消费者研究 “MaxDiff 模型”报表
对象数据
图 8.12 “对象数据”分级显示项
注意:对象数据表是可选的,这取决于是否对对象效应建模。
注意:您可以将对象数据放入响应数据表,但您需要在 “对象数据”分级显示项中指定对象效应。
“MaxDiff 模型”报表
“MaxDiff 模型”窗口默认显示以下一些报表,具体取决于您在启动窗口中的选择:
• 第 170 页的 “效应汇总”
• 第 171 页的 “MaxDiff 结果”
• 第 172 页的 “参数估计值”
• 第 173 页的 “Bayes 参数估计值”
• 第 174 页的 “似然比检验”
170 MaxDiff 第8章
“MaxDiff 模型”报表 消费者研究
效应汇总
若模型包含不止一个效应,则显示 “效应汇总”报表。该报表列出模型估计的效应,并提供这
些效应的 LogWorth (或 FDR LogWorth)值的图。该报表还提供一些控件,这些控件可支持
您在模型中添加或删除效应。模型拟合报表会根据在“效应汇总”报表中进行的更改自动更新。
详细信息,请参见 《拟合线性模型》手册的 “标准最小二乘法报表和选项”一章中的 “效应
汇总报表”一节。
在启动窗口中选中 “Bayes 对象效应”后,“效应汇总”报表不显示。这是因为在这种情况下不
执行似然比检验。
图 8.13 显示通过运行 Potato Chip Responses.jmp 中的脚本“口味”的 MaxDiff 获得的“效应
汇总”报表。
图 8.13 “效应汇总”报表
“效应汇总”表列
“效应汇总”表包含以下列:
源 列出按 p 值升序排序的模型效应。
LogWorth 显示每个模型效应的 LogWorth,定义为 -log10(p 值)。这种变换调整 p 值以提供
适合的绘图尺度。大于 2 的值在 0.01 水平下显著 (因为 – log 10 ( 0.01 ) = 2 )。
FDR LogWorth 显示每个模型效应的假发现率 LogWorth,定义为 -log10 (FDR P 值)。这是
用 于 绘 制 和 评 估 显 著 性 的 最 佳 统 计 量。选 中 FDR 复 选 框 可 用 FDR LogWorth 列 替 换
LogWorth 列。
条形图 显示 LogWorth(或 FDR LogWorth)值的条形图。该图在整数值处显示垂直虚线,在
2 处显示蓝色参考线。
P值 显示每个模型效应的 p 值。这是与“似然比检验”报表中显示的显著性检验对应的 p 值。
FDR P 值 显示使用 Benjamini-Hochberg 方法为每个模型效应计算的假发现率 p 值。该方法
调整 p 值以控制多个检验的假发现率。选中 FDR 复选框可用 FDR P 值列替换 P 值列。
有关 FDR 修正的详细信息,请参见 Benjamini and Hochberg, 1995。有关假发现率的详细
信息,请参见 《预测和专业建模》手册中的 “响应筛选”一章或 Westfall et al. (2011)。
第8章 MaxDiff 171
消费者研究 “MaxDiff 模型”报表
“效应汇总”表选项
汇总表下的选项支持您添加和删除效应:
删除 从模型中删除选定的效应。要删除一个或多个效应,请选择与效应对应的行并点击 “删
除”按钮。
添加特征效应 打开一个面板,其中包含针对 “一个表,堆叠”数据格式的数据表中所有列的
列表,以及针对 “多个表,交叉引用”数据格式的特征数据表中的列的列表。选择您要添
加到模型中的列,然后点击列选择列表下的“添加”将这些列添加到模型中。点击“关闭”
关闭该面板。
添加对象效应 打开一个面板,其中包含针对 “一个表,堆叠”数据格式的数据表中所有列的
列表,以及针对 “多个表,交叉引用”数据格式的对象数据表中的列的列表。选择您要添
加到模型中的列,然后点击列选择列表下的“添加”将这些列添加到模型中。点击“关闭”
关闭该面板。
MaxDiff 结果
对于在启动窗口中指定的每个特征效应,显示以下信息:
边缘效用 相应效应水平的感知值的指示符。较大值表明特性的效用大。
边缘概率 测试对象表示其偏好相应效应水平而不是其他所有水平的估计概率。对于每个效
应,边缘概率加总为 1。
条形图 显示边缘概率的条形图。
“效应”列 提供效应名称及其水平的列表。各水平定义边缘效用和边缘概率估计值应用到的
特性。
172 MaxDiff 第8章
“MaxDiff 模型”报表 消费者研究
参数估计值
该报表提供有关参数估计值、拟合准则和拟合算法的详细信息。
图 8.15 显示通过运行 Potato Chip Responses.jmp 中的脚本“口味”的 MaxDiff 获得的“参数
估计值”报表。
图 8.15 “参数估计值”报表
项 列出模型中的项。
估计值 与相应项关联的参数的估计值。在离散选择实验中,参数估计值有时称为成分效用值。
每个成分效用值是与给定项关联的效用的系数。默认情况下,这些估计值基于 Firth 修正偏
倚的最大似然估计量,因此比没有修正偏倚的 MLE 更准确。
标准误差 参数估计值的标准差的估计值。
比较准则
以下拟合统计量显示在报表中并可用来比较模型:AICc (校正的 Akaike 信息准则) 、 BIC
(Bayes 信息准则)、− 2* 对数似然和 − 2*Firth 对数似然。有关前三个测度的详细信息,请参见
《拟合线性模型》手册中的 “统计详细信息”附录。
仅当在启动窗口中选中 “Firth 偏倚调整估计值”复选框时才在报表中包含 − 2*Firth 对数似然
值。该选项在默认情况下是选中的。
第8章 MaxDiff 173
消费者研究 “MaxDiff 模型”报表
对于上述每一个统计量,较小的值指示较好的拟合。
Bayes 参数估计值
项 模型项。
后验均值 项系数的参数估计值。对于老化期之后的每次迭代,计算特定于测试对象的系数估
计值的均值。后验均值是这些均值的平均值。
后验标准差 老化过程后经过几次迭代,特定于测试对象的估计值的均值的标准差。
对象标准差 关于后验均值的特定于测试对象的估计值的标准差。
提示:选择红色小三角选项 “保存对象估计值”以查看单个估计值。
迭代总次数 执行的迭代总次数,包括老化期。
老化迭代次数 废弃的老化迭代次数。该次数等于启动窗口中指定的“Bayes 迭代数”的一半。
174 MaxDiff 第8章
MaxDiff 平台选项 消费者研究
响应者数目 测试对象数
老化后的平均对数似然 基于在老化期后获取的值计算的对数似然函数的平均值。
似然比检验
图 8.17 显示通过运行 Potato Chip Responses.jmp 中的脚本“口味”的 MaxDiff 获得的“似然
比检验”报表。
图 8.17 似然比检验
源 列出模型中的效应。
似然比卡方 针对相应效应检验的似然比卡方统计量的值。
自由度 卡方检验的自由度。
概率 > 卡方 卡方检验的 p 值。
条形图 显示似然比卡方值的条形图。
MaxDiff 平台选项
显示 MLE 参数估计值 (仅当在启动窗口中选定 “分层 Bayes”的情况下才可用。)显示模
型项系数的非 Firth 最大似然估计值和标准误差。这些估计值用作分层 Bayes 算法的起始值。
联合因子检验 (若在启动窗口中选定 “分层 Bayes”,则不可用。) 通过对包含该因子的所有
效应构造似然比检验来检验模型中的每个因子的整体效应。有关联合因子检验的详细信
息,请参见 《拟合线性模型》手册中的 “标准最小二乘法报表和选项”一章。
置信区间 若未选定 “分层 Bayes”,则为 “参数估计值”报表中的每个参数显示置信区间。
若选定 “分层 Bayes”,则置信区间显示在 “Bayes 参数估计值”报表中。构造置信区间时
假定服从正态分布,并且基于后验均值和后验标准差。
估计值的相关性 若未选定 “分层 Bayes”,则显示最大似然参数估计值之间的相关性。
若选定 “分层 Bayes”,则显示参数估计值后验均值的相关性矩阵。基于老化后的迭代次数
计算相关性。像处理数据表中的列那样来处理老化后每次迭代的后验均值。通过计算这些
列的相关性矩阵来获取 “估计值的相关性”表。
比较 执行两个特定备择选择特征之间的比较。您可以选择感兴趣的因子值进行比较。您可以
比较特定的配置:包括通过选中任意复选框来比较左侧或右侧的所有设置。使用任意并不
第8章 MaxDiff 175
消费者研究 MaxDiff 平台选项
会对所有不同特征的组合进行比较,而是会列出所有比较的组合,一次比较一个特征,对
于其他因子维持左侧显示的设置。请参见第 175 页的 ““比较”报表”。
“所有水平比较”报表 显示 “所有水平比较”报表,其中包含一个表,表中含有关于特征的
所有配对比较的信息。若您是针对对象效应建模,则必须指定对象效应的组合,并且该表
针对于对象效应的组合。表中每个单元格都显示行水平和列水平的效用差异、差值标准误
差,以及无差异检验的 Wald p 值。
警告:未针对多重比较修正 p 值。仅将这些结果用作指导。
“比较”报表
指定配对比较时显示 “比较”报表。其中包含以下列:
因子 显示您指定的测试对象因子的水平。
比较 1 显示第一个比较成分中的特征变量的因子和水平。
176 MaxDiff 第8章
MaxDiff 平台选项 消费者研究
比较 2 显示第二个比较成分中的特征变量的因子和水平。
效用 1 显示在 “因子”列中指定的测试对象的第一个成分的估计效用。
效用 2 显示在 “因子”列中指定的测试对象的第二个成分的估计效用。
概率 1 显示对于 “因子”列中指定的测试对象,相对于第二个成分更偏好第一个成分的预测
概率。
概率 2 显示对于 “因子”列中指定的测试对象,相对于第一个成分更偏好第二个成分的预测
概率。
优比 1 概率 1 与概率 2 之比。
优比 2 概率 2 与概率 1 之比。
比较差异 效用 1 与效用 2 之差。
标准差 比较差异估计值的样本标准误差。
保存 Bayes 链
图 9.1 提升护发用品营销活动效果的示例
178 提升模型 第9章
“提升”平台概述 消费者研究
“提升”平台概述
使用 “提升”平台对某项市场活动或治疗对个体的增量影响建模。提升模型帮助我们识别最可
能响应某项市场活动的个体群组。特定群体的识别有助于制定高效、有针对性的决策,进而合
理优化资源分配,对个体产生一定的影响。(请参见 Radcliffe 和 Surry, 2011。)
“提升”平台拟合分割模型。传统的分割模型旨在找到能够优化预测的拆分,而提升模型却是要
找到能使处理差异最大化的拆分。
提升分割模型可以解释为什么一些个体对处理有反应,而另一些却没有。该模型对每个可能的
(二元)拆分会拟合一个线性模型。若响应变量是连续型,就构建拆分、处理以及两者交互作用
的线性函数。若响应变量是分类型,就构建拆分、处理以及两者交互作用的 Logistic 函数。在
以上两种情况中,交互项用于衡量两个拆分中个体组在提升中的差异。
“提升”平台通过比较所有可能的拆分上交互作用检验的显著性来定义拆分准则。然而,仅基于
p 值选择预测变量会带来偏倚,其倾向于选择具有很多水平的预测变量。为此,JMP 调整了 p 值
以考虑水平数的影响。(请参见 JMP 网站上的论文 “Monte Carlo Calibration of Distributions
of Partition Statistics”。) 因此,“提升”平台通过选择对交互作用效应进行 t 检验时最大的调
整 p 值来确定拆分。报表中给出了每个调整 p 值的 logworth 值,即 -log10( 调整 p 值 )。
“提升”平台的示例
Hair Care Product.jmp 样本数据表来自一个营销活动,该活动旨在提高男性和女性对染发产品
的购买量。为了设计该研究并跟踪购买行为,我们选取了一家大型美发连锁店的 126,184 名持有
“会员卡”的会员为研究对象。并从中随机抽取一半的会员,向他们发送该产品的促销信息。接
下来我们追踪了所有持有会员卡的会员在随后三个月对该产品的购买行为。
数据表包含一个促销列,表示会员是否收到了促销资料。购买列表示会员在试验期内是否购买
了产品。对于每个会员,我们还收集了以下信息:性别、年龄、头发颜色 (自然) 、美国地区
和住处 (会员是否居住在城市地区)。数据表还包含一个验证列,包含大约 33% 的测试对象。
对于分类响应,“提升”平台会把值排序中的第一个水平当做关注的响应进行建模。这是购买列
具有 “值排序”列属性的原因所在,该属性确保 “是”响应排在第一位。
1. 选择帮助 > 样本数据库,然后打开 Hair Care Product.jmp。
2. 选择分析 > 消费者研究 > 提升。
3. 从 “选择列”列表:
‒ 选择促销,然后点击处理。
‒ 选择购买,然后点击 Y,响应。
‒ 选择性别、年龄、头发颜色、美国地区和住处,然后点击 X,因子。
‒ 选择验证,然后点击验证。
4. 点击确定。
第9章 提升模型 179
消费者研究 启动 “提升”平台
5. 在显示的报表中的图形下方,点击执行。
基于验证集的最优拆分数确定为 3。该图形显示在图 9.2 中。请注意,为了显示详细信息我
们对纵坐标的尺度做了修改。
图 9.2 三次拆分后的图形
该图形显示购买的提升发生在具有黑色、红色或棕色头发的女性群体中或具有淡黄色头发的
更年轻的女性(年龄 < 42)会员中。对于男性会员和年龄更大的淡黄色头发的女性会员(年
龄 ≥ 42),促销具有负面影响。
启动 “提升”平台
要启动 “提升”平台,请选择分析 > 消费者研究 > 提升。图 9.3 显示了 Hair Care Product.jmp
样本数据表的启动窗口。“Y,响应”和“X,因子”的输入列可以为连续型,也可以为分类型。
一般来说,“处理”列是分类型,并且通常只有两个水平。若您的 “处理”列包含两个以上的
水平, JMP 会把第一个水平作为 “处理 1”,而把其余的水平合并到 “处理 2”中。
180 提升模型 第9章
“提升模型”报表 消费者研究
图 9.3 “提升”的启动窗口
“提升模型”报表
生成该报表时,表中显示了相关图形、树的初始节点以及拆分控制选项。
提升模型图形
该图形的纵坐标表示响应。横坐标对应的是按拆分节点排列的观测值。对于每个节点,黑色的
水平线表示平均响应。在每个拆分内,都有一个由红线或蓝线表示的处理子拆分。这些线分别
表示该拆分内两个处理组各自的响应均值。处理列的值排序决定了这些线的放置顺序。拆分节
点时,图形会及时更新并在横坐标下方显示拆分,同时会添加垂直线用于分隔这些拆分。
在图形下方是控制按钮:拆分、剪除和执行。仅当有验证集时才显示 “执行”按钮。除此之外,
还显示了 “处理”列的名称及其两个水平,称之为 “处理 1”和 “处理 2”。若 “处理”列包
含两个以上的水平,除了将第一个水平视为单独的水平外,其他水平统一合并为 “处理 2”。
“处理”列信息的右侧是一个报表,它显示与预测有关的汇总值。(请记住预测不是提升建模的
目标。)随着节点的拆分报表会相应更新。若使用验证集,则显示训练集和验证集的值。
第9章 提升模型 181
消费者研究 “提升模型”报表
注意:较低的 R 方值表明有一些变量没有包含在模型中,因此存在大量未解释的变异。不
过,若数据受到大量内在变异影响,即便提升模型是有效的, R 方值也可能比较低。
提升决策树
图 9.4 第一次拆分的节点
“候选项”报表
每个节点还包含一个 “候选项”报表。该报表提供下列信息:
项 模型项。
LogWorth 对给定项的所有可能拆分中最大的 Logworth 值。拆分对应的 Logworth 通过对调
整 p 值取 -log10 来计算。
F比 当响应为连续型时,会提供线性回归模型中与交互作用项相关的 F 比。回归模型中指定
响应为处理、二元拆分及两者交互作用的线性函数。响应为分类型时,则会提供名义型
Logistic 模型中交互作用项的卡方值。
Gamma 当响应为连续型时,该值为在计算 F 比时使用的线性回归模型中的交互作用项的系
数。当响应为分类型时,该值反映了根据 Firth 调整的对数优势比构造的交互作用估计值。
截断点 若模型项为连续型,则该点为拆分点;若模型项为分类型,该点描述了第一个拆分节
点 (左节点)的内容。
“提升”报表选项
除了下面所述的选项之外,“提升”报表的其他所有红色小三角选项均在 “分割”平台的相关
文档中进行了介绍。有关这些选项的详细信息,请参见 《预测和专业建模》手册中的 “分割模
型”一章。
第9章 提升模型 183
消费者研究 “提升模型”报表
最小拆分大小
该选项显示一个窗口,您可以在其中输入一个数字或占总样本大小的比例来定义允许的最小拆分
大小。要指定一个数字,请输入大于等于 1 的值。要指定占样本大小的比例,请输入小于 1 的值。
“提升”平台的默认值设置为 25 或用行数除以 2,000 后的整数部分 (取两者之间较大的值)。
列提升贡献
该表和图显示了列对于提升树的贡献。列的贡献通过计算与其拆分关联的 F 比值之和得来。回
想一下我们之前介绍的,这些值用于测量线性回归模型中的处理和拆分节点变量交互作用项的
显著性。
提升图形
考虑训练集中的观测数。对某一观测值带来的提升定义为针对不同的处理水平进行预测的响应
概率或响应均值的差异。这些提升值按降序排序。“提升图形”在纵坐标显示提升值。该图形在
横坐标显示不同提升值下观测所占的比例。
图 9.5 中显示了针对 Hair Care Product.jmp 样本数据表进行三次拆分后的 “提升图形”示例。
请注意,对于后面的两组测试对象 (男性组和年龄 ≥ 42 的非淡黄色头发的女性组),促销具有
负面影响。
“提升图形”中显示的水平线绘制了验证集的图形。具体来说,首先根据验证集对决策树进行评
估,然后 “提升图形”根据估计的提升值构造提升图形。
图 9.5 提升图形
保存列
保存差异 保存观测节点的各个处理水平上响应均值的估计差值。这是对提升的估计。
保存差异公式 保存差异或提升的公式。
184 提升模型 第9章
“提升模型”报表 消费者研究
发布差分公式 创建差分公式并将其另存为“公式存储库”平台中的公式列脚本。若未打开“公
式存储库”报表,该选项将创建 “公式存储库”报表。请参见 《预测和专业建模》手册中
的 “公式存储库”一章。
第 10 章
项目分析
按项目和对象分析测试结果
图 10.1 项目分析特征图
186 项目分析 第 10 章
项目分析的示例 消费者研究
项目分析的示例
本例使用 MathScienceTest.jmp 样本数据表,该表是来自 1996 年开展的第三次国际数学和科学
研究项目 (TIMMS) 的数据的子集。该数据表关于 1236 个答题者在 14 个问题上的得分 (1 = 正
确, 0 = 不正确)。您可以通过检查前四个问题,了解问题与答题者的数学能力之间的关系。测
试中的问题即用于测量潜在数学能力的项目。拟合该数据的 2PL 模型。
1. 选择帮助 > 样本数据库,然后打开 MathScienceTest.jmp。
2. 选择分析 > 消费者研究 > 项目分析。
3. 从题 1 一直选择到题 4,点击 Y,测试项目,然后点击确定。
图 10.2 项目响应报表
第 10 章 项目分析 187
消费者研究 项目分析的示例
从对偶图中,您会注意到:Q4 是四个问题中最容易回答的问题,这是因为它具有最低的难
度得分 -1.78。Q3 是最难的问题,其难度得分为 0.46。大多数响应者都落在能力尺度的中间
到低端,如图中心部分的数据点所示。在该直方图中,您可以看到大约 40% 的响应者落在
稍微高于能力尺度上的 0 的位置。
注意:答案全部正确或全部不正确的个人不包括在分析中。详细信息,请参见第 195 页的
“拟合 IRT 模型”。
4. 点击灰色的 “特征曲线”报表展开图标将其打开。
5. 点击 “项目分析”红色小三角菜单,然后选择横向图数。
6. 输入 2 并点击确定。
7. 点击灰色的 “信息图”报表展开图标将其打开。
图 10.3 项目响应示例
Q1 具有平直的特征曲线和平直的信息曲线。这表明 Q1 没有为区分响应者的数学能力提供太多
信息。 Q2 的特征曲线比较陡峭,这表明 Q2 对于区分响应者能力很有用。每个图中的垂线都位
于特征曲线的拐点。这条垂线即响应者有 50% 的概率正确回答指定问题的能力水平。
188 项目分析 第 10 章
启动 “项目分析”平台 消费者研究
启动 “项目分析”平台
通过选择分析 > 消费者研究 > 项目分析启动 “项目分析”平台。
图 10.4 “项目分析”启动窗口
Y,测试项目 分配两个或更多要分析的列。这些列必须是数值和连续型,并且仅包含 0 和 1。
频数 指定一个频数变量。该选项适用于汇总数据,
依据 为 “依据”变量的每个水平生成单独报表。若分配了多个 “依据”变量,则为 “依据”
变量水平的每个可能组合生成单独报表。
模型 通过以下选项指定所需模型:
Logistic 2PL 2 参数 Logistic 模型。
Logistic 3PL 3 参数 Logistic 模型。
Logistic 1PL 带 Rasch 参数化的单参数 Logistic 模型。
• 稳定模型参数的估计。
• 加快计算。
• 减少各项之间的推测参数的变异性,但会带来一些偏倚。
较大的罚值会强制推测参数为 0,而较小值则会帮助减少各项之间的推测参数的变异性。值为 0
可用于表示无罚值。
“项目分析”报表
初始 “项目分析”报表显示 “对偶图”和 “参数估计值”报表。项目特征曲线和整体信息图在
初始报表中是关闭状态。
特征曲线
“特征曲线”报表包含您在启动窗口中指定的每个项的项目特征曲线 (ICC)。
项目特征曲线绘制根据能力正确回答某个项目的概率。能力的测量做了标准化处理,所以能力
为 0 的响应者即具有平均能力的响应者。固定能力水平的正确回答的观测概率数据点将会绘制
出来。将拟合特征曲线与数据点作比较为每个单独的项提供了直观的模型拟合优度测度。此外,
特征图还包含一条背景信息曲线以及位于特征曲线拐点处的垂线。背景信息曲线是项目特征曲
线的斜率图,在拐点处最大化。
图 10.5 项目特征曲线
信息图
“信息图”报表包含整体信息曲线图,通过加总各个项的信息曲线可构造整体信息曲线图。可以
通过信息图洞察该测验能够测量的正确能力水平。图 10.6 描述了这样一个测验,测验题目更适
用于评估具有平均到低能力水平的个人,而不是具有高能力水平的个人。
图 10.6 信息图
对偶图
“对偶图”报表包含一个图,这一个图中既显示项目难度又显示对象能力。难度和能力以相同的
标准化度量尺度显示在 y 轴上。项目按照其难度标绘在图的左侧。对象绘制在右侧,随同显示
的还有数据点和一个直方图。对偶图支持您将每个项目的难度关联到每个响应者的能力。
第 10 章 项目分析 191
消费者研究 “项目分析”报表
图 10.7 对偶图
参数估计值
“参数估计值”报表包含每个项目的估计参数表。提供的参数取决于分析中使用的模型 (1PL、
2PL 或 3PL)。
项目 测试项目。
难度 b 参数或项目难度的测度。难度参数的直方图显示在难度估计值旁边。
分辨力 (仅适用于 2PL 和 3PL 模型。)a 参数或项目分辨力的测度。分辨力参数的直方图显示
在分辨力估计值旁边。
阈值 (仅适用于 3PL 模型。) c 参数或推测测度。
192 项目分析 第 10 章
“项目分析”平台选项 消费者研究
“项目分析”平台选项
横向图数 支持您指定在 “特征曲线”报表中的每行图中显示多少个 ICC 图。默认设置为每行
显示一个 ICC 图。
保存能力公式 将能力公式保存到数据表的新列中。请参见 《使用 JMP》手册中的 “JMP 报
表”一章,获取有关下列选项的信息:
恢复 包含使您可以重复运行分析或重新启动分析的选项。在支持该功能的平台中,“自动重新
计算”选项可将您对数据表所做的更改立即体现在相应的报表窗口中。
保存脚本 包含使您可以保存脚本的选项,该脚本可在多个指定位置重新生成报表。
保存 “依据”组脚本 包含使您可以保存脚本的选项,该脚本可在多个指定位置为 “依据”变
量的所有水平重新生成平台报表。仅当在启动窗口中指定 “依据”变量时才可用。
“项目分析”平台的统计详细信息
项目响应原理 (IRT) 使用一系列等式将项目关联到未观测到的 (潜在)特征或能力。项目 (或
问题)是无法直接观测到的底层潜在构造的指示符。收集数据时,对象能力和项目特征均未知。
项目响应曲线
项目响应曲线 (项目特征曲线)用于描述能力 (在能力尺度上定义)与每个项目之间的关系。
项目响应曲线绘制针对不同能力水平正确回答某个项目的概率。对于极具分辨里的题目,能力
低 于 阈 值 的 响 应 者 答 对 的 概 率 为 0%,而 能 力 高 于 阈 值 的 响 应 者 者 答 对 的 概 率 为 100%
(图 10.8)。
图 10.8 有极佳分辨力的项目的特征曲线
正确回答某个项目的概率与能力之间的典型关系是一个具有下渐近线和上渐近线的 S 形函数。
随着响应者能力的增加,其正确回答该项目的概率将增至 100%。特定项目的曲线形状与该项目
的难度和分辨力属性相关。
第 10 章 项目分析 193
消费者研究 “项目分析”平台选项
图 10.9 典型的项目响应曲线
项目响应曲线模型
1 参数、2 参数和 3 参数 Logistic 模型可用于对项目响应曲线建模。3 参数 Logistic (3PL) 模型定
义如下。
1–c
P ( θ ) = c + -------------------------------------
-
–( a ) ( θ – b )
1+e
• P(θ) 是针对能力水平 θ 正确回答该项目的概率。有关拟合项目响应原理模型的详细信息,请
参见第 195 页的 “拟合 IRT 模型”。
• a 参数定义曲线拐点处的陡度。它提供该项目分辨力的估计值。
• b 参数定义拐点在能力轴上的位置。它提供该项目难度的估计值。
• c 参数是下渐近线。它提供通过推测正确回答某项目的概率估计值。
• 对于 2PL 模型, c 参数设置为 0。
1
P ( θ ) = -------------------------------------
-
–( a ) ( θ – b )
1+e
• 对于 1PL 模型, c 参数设置为 0, a 参数设置为 1。这种参数化亦称 Rasch 模型 (Rasch,
1980)。
1
P ( θ ) = ------------------------------
-
–( θ – b )
1+e
a 参数:项目分辨力
应项目的概率较高。曲线相对平直的项目具有较低的分辨力。分辨力较低的项目可以考虑从测
量手段中删除。
图 10.10 不同 a 值的 Logistic 模型
b 参数:项目难度
b 参数 (或相对于能力的拐点位置)提供了项目难度测度。拐点在能力尺度上靠右的项目响应
曲线指示项目比起拐点靠左的项目更难回答。在 1PL 和 2PL 模型中,b 参数为有 50% 的概率正
确回答项目所需的能力水平提供了估计值。
图 10.11 不同 b 值的 Logistic 曲线
c 参数:推测
图 10.12 不同 c 值的 Logistic 模型
IRT 模型假设
拟合 IRT 模型
L
xj 1 – xj
p ( x θ, ϑ ) = ∏ pj ( θ ) ( 1 – pj ( θ ) )
j=1
∞
p(x) = p ( x θ, ϑ )g ( θ υ ) dθ
–∞
注意:针对测试问题的缺失值被视为错误响应。答案全部正确或全部不正确的个人不包括在分
析中。
能力公式
“项目分析”红色小三角菜单的 “保存能力公式”选项将能力公式保存至数据表中的新列。该
公式可用于对添加至数据表的其他对象评分,或者可将该公式复制到新表以便对新的一组对象
评分。
保存到数据表的函数称为 IRT 能力函数。项目参数估计值以矩阵的形式存储在该函数中。
附录 A
参考文献
Agresti, A. (2002), Categorical Data Analysis, Second Edition, New York: John Wiley and
Sons, Inc.
Akaike, H. (1974), “Factor Analysis and AIC,” Pschychometrika, 52, 317–332.
Akaike, H. (1987), “A new Look at the Statistical Identification Model,” IEEE Transactions on
Automatic Control, 19, 716–723.
Bartlett, M.S. (1954), “A Note on the Multiplying Factors for Various Chi Square
Approximations,” Journal of the Royal Statistical Society, 16 (Series B), 296-298.
Benzécri, J. P. (1979), “Sur le calcul des taux d’inertie dans l’analyse d’un questionnaire,
addendum et erratum à [BIN. MULT.],” Cahiers de l’ Analyse des Données, 4, 377–378.
Borg, I. and Groenen, P. J. F. (2005), Modern Multidimensional Scaling: Theory and
Applications, Second Edition, New York: Springer.
de Ayala, R. J. (2009), The Theory and Practice of Item Response Theory. New York: The
Guilford Press.
Dwass, M. (1955), “A Note on Simultaneous Confidence Intervals,” Annals of Mathematical
Statistics 26: 146–147.
Farebrother, R.W. (1981), “Mechanical Representations of the L1 and L2 Estimation
Problems,” Statistical Data Analysis, 2nd Edition, Amsterdam, North Holland: edited by Y.
Dodge.
Fieller, E.C. (1954), “Some Problems in Interval Estimation,” Journal of the Royal Statistical
Society, Series B, 16, 175-185.
Firth, D. (1993), “Bias Reduction of Maximum Likelihood Estimates,” Biometrika 80:1, 27–38.
Goodnight, J.H. (1978), “Tests of Hypotheses in Fixed Effects Linear Models,” SAS Technical
Report R–101, Cary: SAS Institute Inc, also in Communications in Statistics (1980), A9 167–
180.
Goodnight, J.H. and W.R. Harvey (1978), “Least Square Means in the Fixed Effect General
Linear Model,” SAS Technical Report R–103, Cary NC: SAS Institute Inc.
Greenacre, M. J. (1984), Theory and Applications of Correspondence Analysis, London:
Academic Press.
Heinze, G. and Schemper, M. (2002), “A Solution to the Problem of Separation in Logistic
Regression,” Statistics in Medicine 21:16, 2409–2419.
Hocking, R.R. (1985), The Analysis of Linear Models, Monterey: Brooks–Cole.
Hosmer, D.W. and Lemeshow, S. (2000), Applied Logistic Regression, Second Edition, New
York: John Wiley and Sons.
198 参考文献 附录 A
消费者研究
Jackson, J.E. (2003), A User’ s Guide to Principal Components, New York: John Wiley and
Sons, Inc.
Kaiser, H.F. (1958), “The varimax criterion for analytic rotation in factor analysis”
Psychometrika, 23, 187–200.
Kish, L. (1965), Survey Sampling, New York: John Wiley and Sons, Inc.
Lavassani, K.M., Movahedi, B., and Kumar, V. (2009). “Developments in Analysis of Multiple
Response Survey Data in Categorical Data Analysis: The Case of Enterprise System
Implementation in Large North American Firms,” Journal of Applied Quantitative
Methods, Vol. 4, No. 1, 45–53.
Louviere, J.J., Flynn, T.N., and Marley, A.A. (2015), Best-Worst Scaling: Theory, Methods and
Applications, Cambridge University Press.
McFadden, D. (1974), “Conditional Logit Analysis of Qualitative Choice Behavior,” in P.
Zarembka, ed., Frontiers in Econometrics, pp. 105–142. See
http://eml.berkeley.edu/reprints/mcfadden/zarembka.pdf. Retrieved 4/25/2016.
Radcliffe, N. J., and Surry, P. D. (2011), “Real-World Uplift Modelling with Significance-Based
Uplift Trees,” Stochastic Solutions White Paper, Portrait Technical Report TR-2011-1.
Rasch, G. (1980), Probabilistic models for some intelligence and attainment tests, University of
Chicago Press.
Reichheld, F. F. (2003) “The One Number You Need to Grow,” Harvard Business Review, Vol.
81 No. 12, 46-54.
Rossi, P.E., Allenby, G.M., and McCulloch, R. (2006), Bayesian Statistics and Marketing, Wiley
& Sons, Ltd.
SAS Institute (2009), SAS/STAT 9.2 User’ s Guide, Second Edition, Chapter 92, SAS Institute
Inc., Cary NC. See
https://support.sas.com/documentation/cdl/en/statug/63033/HTML/default/viewer.htm#sta
tug_ttest_a0000000126.htm. Retrieved 7/14/2016.
Train, K. E. (2001), “A Comparison of Hierarchical Bayes and Maximum Simulated Likelihood
for Mixed Logit,” Department of Economics, University of California. See
https://eml.berkeley.edu/~train/compare.pdf. Retrieved 11/7/2016.
Train, K.E. (2009), Discrete Choice Methods and Simulation, Cambridge University Press.
Waern, Y. (1972) “Structure in Similarity Matrices: A graphic approach,” Scandinavian Journal
of Psychology, Vol. 13, 5–16.
Wright, S.P. and R.G. O’Brien (1988), “Power Analysis in an Enhanced GLM Procedure: What
it Might Look Like,” SUGI 1988, Proceedings of the Thirteenth Annual Conference, 1097–
1102, Cary NC: SAS Institute Inc.
索引
消费者研究
A G
按对象保存梯度 , MaxDiff 175 公因子分析 89, 95
按对象保存梯度 , “选择”平台 107, 127, 158 估计值的相关性 ,MaxDiff 174
B I
Burt 表 , 多重对应分析 70 IRT 25, 185
保存效用公式 , MaxDiff 175
保存效用公式 , “选择”平台 127 J
比较 , MaxDiff 174
比萨饼选择示例 138–141 检验每个响应 34
比萨饼选择示例 , MaxDiff 158–160 检验响应齐性 34
边缘效应 , “选择”平台 125 “交叉表”选项 , 多重对应分析 66
补充 ID 变量 , 多重对应分析 64 经典测试理论 185
D L
陡坡图 97 联合因子检验
MaxDiff 174
独立性检验 , 多重对应分析 66
对象数据 , “选择”平台 121 联合因子检验 , “选择”平台 125
对应分析选项 66
多重对应分析 M
Burt 表 70 MaxDiff
补充 ID 变量 64 按对象保存梯度 175
独立性检验 66 保存效用公式 175
“交叉表”选项 66 比萨饼选择示例 158–160
平台选项 66 估计值的相关性 174
启动窗口选项 64 “所有水平比较”报表 175
特征数据 167
F 响应数据 167
“分类”平台 27 最优最差缩放 158
报表 32 MaxDiff, 联合因子检验 174
超类别 41
结构化 30 P
启动窗口 29 “频数”变量 93
自由文本 30
200 索引
消费者研究
Q Y
潜在特征 185 “依据”变量 93
“权重”变量 93 “因子分析”平台
“频数”变量 93
S “权重”变量 93
“依据”变量 93
使用字母进行比较 35, 41 因子数 95
似然比检验 125
“所有水平比较”报表 , MaxDiff 175
Z
T 正交变换 95
支付意愿 , “选择”平台 127
探索性因子分析 89 置信区间 , MaxDiff 174
特征数据 , MaxDiff 167 主成分 95
特征数据 , “选择”平台 118 最优最差缩放 158
特征值 97
提升模型 177
报表 180
报表选项 182
概述 178
平台 179
W
“无选择”选项 , “选择”平台 117, 121
X
“项目分析”平台 188
报表 189
选项 192
项目特征曲线 189
项目响应原理 25, 185
响应数据 , MaxDiff 167
斜交变换 95
选择建模 105–154
“选择”平台
按对象保存梯度 107, 127, 158
保存效用公式 127
边缘效应 125
对象数据 121
联合因子检验 125
特征数据 118
“无选择”选项 117, 121
细分 107, 158
支付意愿 127
旋转方法 95