IBM® SPSS® Modeler 高级版是一个高绩效的预测性和文本分析工作台, 从数据中为您提供前所未有的洞察力。您的企业可以取得卓越成果并最终获得正投资回报,因为这个工作台可使您根据预测智能做出重要商业决策。
各类企业都发现他们可以使用 SPSS Modeler 的预测智能吸引客户, 强化其忠诚度,更具成本效益地减少客户流失和降低风险。公共部门组织可从 SPSS Modeler 的使用中大受♂裨益。他们可预测员工量能, 前瞻性地应对公共安全问题,管理学生生命ζ 周期,改善课堂表现和应对许多其他的运营挑战。
通过使用历史数据,SPSS Modeler 可使您自信预测结果,理解您数据中隐藏的关系。有了这种理解力,您可使用强大可靠的分※析技术,更深入地洞察您的客户、学生或选民,更快解决任何业务问题。
但如果您的大部分数据都呈现为非格式化或文本的形式——评论、文件或网页中——该怎么办呢?只使用结构化数据的建模可能不能完全展现您的业务流程和结果。
SPSS Modeler 高级版允许您【挖掘所有形式数据中包含的预测智能。它的分析对象不仅仅是结构化数值型数据,还包括网页活动、博客内容、客户反馈、电子邮件、文章等非结构化数据信息,可发现概念和观点的关系,尽可能建立最准确的预测模型「。
它的实体分析功能可在记录中解决身份识别冲突,使您增强当前数据的连贯性和一致性。在客户关系管理、诈欺检测、反洗钱和安全方面,身份识别★解决方案至关重要。
SPSS Modeler 高级版中的社交网络功能将关系信息转化为关键绩效指标,展现个体和群体的社交行为▆。于是您就能认出在网络中影响他人行为的●社交领袖。将这些结果与其他措施结合起来,您可以建立完善的个人档案,将其作为您预测模型的基础。
SPSS Modeler 高级版可使您在交互、可视的环境中同时进行文本分析和数据挖掘。用户可在直观的图形界面中轻松查看“数据流”中数据挖掘流程的每个步骤。文本分析简单、高效,借助交互图表帮助∞您探索和展示文本数据和模式以进行即时分析,强大的分类和归类技术可将文本转化成可分析□ 的资产。
深入了解 IBM SPSS Modeler 高级版
借助 SPSS Modeler 高级版独特的功能组合,您在规划和做出日常决策时可更加专注和敏捷。使您更好地了解您的企业、运营环境、客户和其他利益相关者。这些功○能包 括:
• 实体分析——企业经◆常合并多种数据来源。但记录里没有明确♀的匹配时该怎么办呢? SPSS Modeler 高级版的实体分析功能可让您发现这些关系,并提供不明显的身份识别和关系认知。这使您可在适宜时巩固记录——或将︽其分开。实体分析在边境安※全、检测欺诈和适当识别犯罪嫌疑人方面十分重要。但对想要¤在营销活动中避免向同一人提供不同报价, 或是确保正在建立准确模型的企业来说也非常有用。
社交网络分析——发现社交实体间的关系和这些关系对个体行为产生的卐影响。SPSS Modeler 高级版的社交网络分析功能对电信行业和其他关注流失的行业来说特别有用。您可以识别出不同的群体和群体领袖,并根据领袖的影响力判断成员是否会流失。该软件包含可大大增强模型、预测流失的。
两大功能:
–群体分析——在数据中识别∑ 群体及其领袖。
–扩散分析——使用现有的流失信息找出当№前的流失人员和人员流失的影响因素。
• 大数据分析——IBM SPSS Modeler 高级版可轻松整▃合
IBM 和非 IBM 数据库,更快、更有效地部署模╲型并对模型评级。可在数据库内部对数据评分,也可实时对事务型数据评分,如大额销售量、客户服务和▼索赔事务。
• IBM Cognos 软件集成——分析人员可通过 Cognos Business Intelligence 软件直接访问结构化数据, 快速、可靠地判断具体结果的可能性。您可以向业务用户和所有依赖 Cognos 仪表板的利益相关者均提供从客户视〖图收集的、结合了结构化和非结构化数据的预测智能。
IBM Netezza 功能——在 Netezza 设备中可执行数据库内分析,建立和←部署可按比例显示页面大小的分析型应用程序,在今天只有超级电脑能够访问。
有 SPSS Modeler 高级版可使您直接访问文本、网页和调查数据,并将这些额外类型的数据整合到您的】预测模型中,获得更有用的建议和更优结果——借助实体分析确保您正在使用最佳数据进行建模。通过可靠的自然语言处理(NLP)语言提取流程,SPSS Modeler 高级版可从多种非结构化○数据中提取〓关键概念并将其分类。交互文本挖掘工作台可节约您的时间和精力,帮助您获得竞争↓优势。与其他文本分析工具不同的是,您不需要具备任何语言学背景就可以使用。使用可管理文本提取流程的集成资源Resource Editor,您可轻松自定义特定领域的概念词典。这使您能够更快查找相关概念和关联信息。随后可将提取出√的概念、意见和分类与结构化数据组合,应用于预测模型,获得对行动、行为、模式和关联的有价值的洞察力。
• 分类算法—— 使用决策树(Decision Tree)、神经网络
(Neural Networks) 、 逻 辑 回 归 (Logistic Regression) 、 支 持 向 量 机 (Support Vector Machines)、多因素(Cox)回归和广◤义线性混合模型(GLMM)等技术,根据历史数据进行预▲测和预报。将自动分类模型同时用于二进制和数值型★结果,简化模型创建。
分割算法—— 凭借自动集群、异常检测和集群神经网络技术,将人员分类或检测不寻常模式。使用自动分类可在一个步骤中使用多种算法,不必在选择合适技术时猜来猜去。
• 关联算法—— 使用Apriori、CARMA 和序列关联发现关联、链接或序列。
• 时间数列与预测——使用统计建模技术对一个或多个时间序列做出预测。
支持跨企业数据挖ㄨ掘
• SPSS Modeler 高级版可高效分析大量来自中小型企业的典型数据。需要挖掘大容量或复杂数据的企业可使用 IBM SPSS Modeler 高级版服务器。通过使用客户端/服务器架构,SPSS Modeler 高级版服务器可在不消耗计算资源的情况下,让多个分析人员同时工作。企业版支持在领先的平台上进行数据库内挖♂掘,高效处理大量数据。
• SPSS Modeler 高级版服务器还提供了额外的部署选项,帮助您跨地域和功能进行预测分析,更快将结果提交至决策者手中。例如,结合使用 SPSS Modeler 高级 版 与 IBM SPSS Collaboration and Deployment Services,可助您管理分析资产和自动化分析流程。
IBM SPSS Modeler 高级版◎功能 |
|
数据理解 |
• 凭借自动辅助创建大量互动图表 • 使用可视链接分析查看您数据中的关联信息 • 通过在图表中选择地区和项目及查看所选信息,进行数据交互;或选择关键信息进行分析 • 可直接从 SPSS Modeler 高级版界面访问 SPSS Statistics 图表和报告工具 |
数据准备 |
• 可访问来自 Cognos Business Intelligence、IBM DB2®、Oracle、Microsoft SQL Server、IBM Informix®、IBM Netezza、 mySQL(Oracle) 和 Teradata 的业@务数据,也可通过 zDB2 和 IBM Classic Federation Server 支持访问大型机数据 • 可导入分割文本文件和固定宽度文本文件、SPSS Statistics 文件、SPSS Data Collection 数据源、Excel、SAS 或 XML • 可从 SPSS Modeler 高级版中选择多种数据清理选项,删除或替换无效数据,自动填充缺失值并减少离群值和极端值 • 使用实体分析结合或分离记々录,获得更纯净的建模数据 • 将自动数据准备用于查询和限制数据,以便在一个单独步骤中进行分析 • 从 SPSS Modeler直接访问 SPSS Statistics 中执行的数据管理和转换 • 使用字段过滤、命名、推导、合并、再范畴化、价值重置和字段重新排序 • 应用记录选择、抽样(包括整群和分层抽样)、合并(包括内连接♀、完全外连接、部分外连接和反对连接)和串联;排序、 聚合和平衡 • 可选择数据再构成、分割和对换选项 • 可选择大量的字符串函数:字符串创建、替代、查找和匹配,空格移除和截断 • 应用 RFM(近因、频数和货币值)评分:合计客户交易,提供价值数并将其结合进行完整的 RFM 分析 • 借助 Group Analysis 可在数据中识别群体及其领袖 • 借助 Diffusion 分析,利用流失信息判断已流失人员最有可能影响的其他即将流失成员 • 可将数据导〇出至数据库、IBM Cognos Business Intelligence 包、SPSS Statistics、SPSS Data Collection,可导出的格式为分割文本文件、Excel、SAS 或 XML |
建模算法 |
• 异常检测——通过使用基于集群的算法检测不寻常的记录 • Apriori——借助高级判断函数的流行关联发现算法 • Bayesian Networks——图形概率模型 • C&RT、C5.0、CHAID 和 QUEST——决策树算法,包括№交互式树构建 • CARMA——支持多结果的关联算法 • Cox 回归——计算事件可能发生的时间 • Decision List——交互式规则建立算法 • Factor/PCA, Feature Selection——数据压缩算法 • IBM InfoSphere*数据库内∩挖掘算法:关联(Association)、集群(Clustering)、决策树(Decision Tree)、逻辑回归(Logistic Regression)、朴▲素贝叶斯(Naive Bayes)、回归(Regression)、序列(Sequence)、时间序列(Time Series) • IBM Netezza*数据库内挖掘算法:贝叶斯网(Bayes Net)、决策树(Decision Trees)、分离集群(Divisive Clustering)、广义线性(Generalized Linear)、K 均方聚类(K-Means)、KNN、线性回归(Linear Regression)、朴素贝叶斯(NaiveBayes)、PCA、回归树(Regression Tree)、时间序列(Time Series) Microsoft SQL Server*数据库内挖掘算法:关联规则(Association Rules)、集群(Clustering)、决策树(Decision Tree)、线性回归(Linear Regression)、朴素贝叶斯(Naive Bayes)、神经网络(Neural Network)、序列集群(Sequence Clustering)、时间序列(Time-Series) • Oracle*数据库内挖掘算法:自适应贝叶斯(Adaptive Bayes)、Apriori、人工智能(AI)、决策树(Decision Tree)、一般线性模▓型(GLM)、K 均方聚类(KMeans)、最小描述长度(MDL)、朴素贝叶斯(Naive Bayes)、非负矩阵分』解(Non-Negative Matrix Factorization)、正交分区集群(Orthogonal Partitioning Clustering)、支持向量机(Support Vector Machine)K-集群(K-Means)、集群网络(Kohonen)、Two Step、Discriminant、支持向量机(SVM)——集群和分割算法 • KNN——最近邻建模和评分算法 •逻辑回归(Logistic Regression)——面向二进制结果 •神经网络(Neural Network)——具有反向传播学习和径向基函数网络的多层感知器 •回归(Regression)、线性(Linear)、一般线性模型(GLM)、广义线性混合模型(GLMM)——线性方程模型 •自学响应模型(SLRM)——具有增量学习的贝叶斯模型 •序列(Sequence)——面向序列敏感分析的序列关联算法 •支持向量机(Support Vector Machine)——面向广泛数据∮集的精准高级算法 •时间序列(Time-Series)——生成和自动选择时间序列预测模型 |
建模和评估 |
•结合使用大量数据挖掘算法和高级功能,从您的数据中获取最〖佳结果 • 使用自动(二进制和数值型)分类和集群,取代选择单一算法 • 使用交互模型和方程浏览器,查看高级统计输出 • 借助变量重要性图表,在预测的结果中展示数据属性的相关影响 • 在地图中可视化分析结果 • 结合多种模型(集成建模)或使用一种模型分析另一种模型 • 使用 SPSS Modeler Component-Level Framework(CLEF)集成自定义算法 • SPSS Statistics 集成,使用 R 型统计编程语言扩充分析选项◥ |
部署 |
•使用 SQL 或 PMML(预测模型的基于 XML 的标准格式)导出模型 • 使用 IBM SPSS Collaboration and Deployment Services 进行创新分析管理、流程自动化和部署功能
|
文本链接分析 |
• 从荷兰语、英语、法语、德语和西班牙语文本中▂识别和提取情感(例如喜恶) •识别链接及其关联,例如人和事件或疾病和基因 • 从博客里的网↑站链接(URL)中识别和提取内容 • 意见、语义关系和链接事件列入可部署的预测模型 • 通过展示两种概念之间的多种语义链接的交互图表,揭示其复杂关系
|
SPSS Modeler 服务器* |
• 使用领先的数据库技术并利用高绩效的数据库实现,使用数据库内挖掘在数据库内建立模型 • 使用 SQL-pushback 推动数据转换并选择建模算法直接用于您的操作数据库 • 通过 IBM SPSS Modeler Server Scoring Adapters 在数据库内计算数据得分,显著提高性能 • 通过并行@ 执行数据流和多种模型,利用包括 IBM System z 大型机在内的高绩效硬件,可更快创建解决方案并取得更佳投资回报率(ROI) • 通过安全套接字层(SSL)加密,可在 SPSS Modeler Client 和 SPSS Modeler Server间安全传输敏感数据
|