认知技术的数据准备与应用实践

立即解锁
发布时间: 2025-09-07 01:51:48 阅读量: 16 订阅数: 29 AIGC
PDF

人工智能如何赋能企业

### 认知技术的数据准备与应用实践 #### 1. 认知技术工具选择 在认知技术领域,像 SAS 和 IBM 的 SPSS 等公司提供了丰富的工具。例如,SAS Enterprise Miner 产品中提供机器学习和神经网络分析功能已有二十多年,同时也能用 SAS 技术构建深度学习模型。如果公司员工对这些工具经验丰富且使用顺手,那么选择这些工具可能是最佳方案。 一般而言,若企业计划将认知技术作为核心能力,并体现在多个项目、流程和产品中,那么有必要建立内部专业知识,涵盖专有技术和开源技术。但如果认知应用只是次要或一次性的,那么应尽可能利用外部技术和服务来实现。 #### 2. 数据准备的重要性 优质且丰富的数据是有效部署认知技术的先决条件,尤其是对于基于机器学习的应用,高质量、大容量的数据尤为重要。数据质量要求数据在整个组织内干净、一致且整合良好。 然而,大型组织很少能达到这一理想状态。公司存在大量数据质量问题,很多问题源于一线员工输入数据时产生,且当时缺乏足够的技术或流程来解决。此外,公司往往有多个关键数据来源,这可能是因为业务部门和职能相对独立,或者是因为收购或合并了拥有不同数据库或数据架构的其他组织。解决这些问题既耗时又费力,许多组织对数据管理工作失去了耐心。 传统上,这些问题主要通过自上而下的数据管理框架来解决,最初称为信息工程,现在更多地被称为主数据管理。这些框架明确组织内的关键数据实体及其与其他实体的关系,目标是创建一组在整个组织内正确且一致的“黄金记录”。当公司发现关键实体有多个数据源时,会开展“数据掌握”活动,使用规则引擎匹配相似数据。但通常需要大量规则,且与手动匹配相比,数据掌握节省的时间并不多。 不过,AI(尤其是机器学习)有望解决这些问题。著名数据库技术开发者 Mike Stonebraker 认为,通过机器学习进行“概率匹配”比基于规则的方法更高效。其他自动化或半自动化技术也能辅助数据编目、跟踪数据来源和执行数据治理规则。对使用数据进行 AI 应用感兴趣的公司应考虑采用这些工具。 #### 3. 蒙特利尔银行的数据基础建设 蒙特利尔银行金融集团(BMO)是加拿大“五大银行”之一,也是北美十大银行之一,在美国也有重要业务。 过去几年,在技术与运营主管 Jean - Michel Arès 和首席数据官 Francois Joanette 的领导下,BMO 对其技术基础设施进行了一系列改造。与许多大型银行一样,遵守监管要求是首要任务,同时银行也需要更新数据存储和报告的基本流程。数据科学和认知技术虽受银行关注,但由于它们严重依赖大量高质量数据,因此这些新技术需等待基础设施改善。 到 2017 年,许多必要的基础设施改进已完成,BMO 开发了一个智能数据核心,以支持未来的分析、数据科学和认知活动。该智能核心包括数据记录供应、参考数据、数据治理(银行内有十七个治理社区)和元数据中心。银行通过数据重用和数据仓库合理化已节省了超过 1 亿美元。核心的“智能”方面包括一个数据科学平台,其中有分析沙箱和用于机器学习的开源软件,以及用于机器人流程自动化的软件。 BMO 的数据驱动活动目标已从主要的防御性应用(监管、安全和风险)转向以客户获取和增长为导向的进攻性应用。公司专注于客户旅程分析、更好地管理客户线索和非结构化客户数据分析等项目。银行在额外收入方面获得的价值已数倍于数据合理化节省的成本。 在认知技术方面,机器学习和机器人流程自动化是银行的主要关注点。机器学习用于客户细分和欺诈预防,机器人流程自动化用于驱动涉及与多个信息系统交互的高度结构化后台流程。例如,银行在高风险调查领域部署了一个 RPA 机器人,它可以收集数据并对案件进行优先级排序,以便人工干预。传统的 RPA 还通过光学字符识别功能将图像转换为文本,并利用机器学习读取非结构化文本、评估和批准决策、跨数据库匹配数据以及将案件分配给最合适的员工。 BMO 对 RPA 的机会持积极态度,但 Arès 和 Joanette 认为,这对 IT 基础设施和业务流程都有重大影响。在基础设施方面,由于 RPA 机器人作为多个后端系统的用户,更改这些系统意味着 RPA 系统也需要更改。如果没有详细的文档说明系统之间的链接以及谨慎的变更管理,架构可能会陷入混乱。在流程方面,RPA 不仅为银行提供了自动化现有流程的机会,还能在实施过程中改进这些流程。幸运的是,与许多公司不同,BMO 当前的业务流程有详细的文档记录。 这些新能力促使 BMO 高管考虑为数据科学和认知技术建立新的组织结构。到目前为止,高级分析和认知专业人员大多分布在各个职能部门和业务单元。但随着这些专家对银行未来的重要性日益增加,人们开始讨论对他们的活动进行更集中的协调。虽然不太可能成立一个完全集中的数据科学团队,但地方职能部门的数据科学家可能会在一定程度上与技术和运营团队进行矩阵式合作。 下面用 mermaid 流程图展示 BMO 的数据驱动活动转变: ```mermaid graph LR A[传统防御性应用] --> B[数据基础设施改进] B --> C[智能数据核心建设] C --> D[进攻性应用:客户获取和增长] D --> E[机器学习应用:客户细分、欺诈预防] D --> F[RPA 应用 ```
corwn 最低0.47元/天 解锁专栏
买1年送3月
继续阅读 点击查看下一篇
profit 400次 会员资源下载次数
profit 300万+ 优质博客文章
profit 1000万+ 优质下载资源
profit 1000万+ 优质文库回答
复制全文

相关推荐

物联网_赵伟杰

物联网专家
12年毕业于人民大学计算机专业,有超过7年工作经验的物联网及硬件开发专家,曾就职于多家知名科技公司,并在其中担任重要技术职位。有丰富的物联网及硬件开发经验,擅长于嵌入式系统设计、传感器技术、无线通信以及智能硬件开发等领域。
最低0.47元/天 解锁专栏
买1年送3月
百万级 高质量VIP文章无限畅学
千万级 优质资源任意下载
千万级 优质文库回答免费看

最新推荐

LNR互操作异常定位方法论:从信令跟踪到根因分析完整路径

![LNR互操作异常定位方法论:从信令跟踪到根因分析完整路径](https://www.telecomhall.net/uploads/db2683/optimized/3X/d/a/da592fb7aadc7208b25968ef013723929a381eed_2_1024x504.jpeg) # 摘要 LNR互操作异常是5G网络部署与演进过程中影响服务连续性与用户体验的关键问题。本文系统梳理了LNR(LTE-NR)互操作的基本原理与信令流程,深入解析了切换、重定向及重建等关键流程中的异常行为及其触发机制。结合多维度信令跟踪与数据采集方法,本文提出了异常识别与分类的技术路径,并构建了

Kubernetes文件夹监控新玩法:Pod级监听的实现方案与性能优化策略

![Kubernetes文件夹监控新玩法:Pod级监听的实现方案与性能优化策略](https://d2908q01vomqb2.cloudfront.net/ca3512f4dfa95a03169c5a670a4c91a19b3077b4/2021/08/02/elamaras_prometheus_f2_feature.png) # 摘要 随着云原生技术的快速发展,Kubernetes作为主流的容器编排平台,其监控能力特别是Pod级监听机制,成为保障系统稳定性和实现自动化运维的关键。本文系统性地介绍了Kubernetes监控体系,并深入分析了Pod级监听的技术原理与实现机制,涵盖Kub

模糊综合评价与多目标优化协同建模方法:复杂问题决策新思路,实战必看

![模糊综合评价与多目标优化协同建模方法:复杂问题决策新思路,实战必看](https://x0.ifengimg.com/res/2023/46902B1569CA5BA4AE0E0F8C5ED6641DBAB9BA74_size119_w1080_h363.png) # 摘要 本文系统探讨了模糊综合评价与多目标优化建模的基本理论、方法流程及其协同应用机制。首先,介绍了模糊集合理论、隶属函数构建及综合评价模型的步骤,并分析了其在实际应用中的局限性。随后,阐述了多目标优化的数学表达、经典求解算法及其评价与可视化手段。进一步地,提出了模糊综合评价与多目标优化的协同建模框架,明确了二者在建模流

【LBM源码深度解析】:从10_Rev尺度多孔介质代码看仿真实现内幕

![10_Rev尺度_REV多孔介质_格子Boltzmann_LBM_多孔介质_源码.rar](https://public.fangzhenxiu.com/fixComment/commentContent/imgs/1687451361941_0ssj5j.jpg?imageView2/0) # 摘要 本文围绕格子Boltzmann方法(LBM)在多孔介质流动仿真中的应用展开,系统介绍了LBM的基本原理、数学模型及其在复杂介质中的建模策略。通过对10_Rev仿真代码的结构与核心模块分析,深入探讨了初始化流程、迭代计算机制及边界条件处理方法。进一步研究了关键算法的性能优化手段,包括并行

PHP与JavaScript应用的托管、报告与分发指南

# PHP与JavaScript应用的托管、报告与分发指南 ## 1. 引言 在当今数字化时代,Web应用的托管、报告生成以及数据分发是数据处理流程中的重要环节。本文将介绍如何利用PHP和JavaScript进行用户数据的收集与分析,同时详细阐述如何将相关应用部署到Amazon Lightsail这一轻量级云托管平台上。 ## 2. 数据收集方法 ### 2.1 主动数据收集 - **二进制数据收集**:通过`ajax.php`、`binary.html`和`create.sql`等文件实现,利用jQuery库进行交互。示例代码如下: ```php // ajax.php部分代码 try

【AvalonDock布局开发终极指南】:从入门到精通掌握窗口管理核心机制

![Avalondock布局控件源码2.0](https://img-blog.csdnimg.cn/acb122de6fc745f68ce8d596ed640a4e.png) # 摘要 AvalonDock 是 WPF 平台下实现多文档界面和灵活布局管理的重要框架,广泛应用于复杂桌面系统的 UI 构建。本文系统介绍了 AvalonDock 的布局系统及其核心概念,深入解析其整体架构、布局机制与序列化原理,并结合开发实践探讨了布局初始化、交互控制与样式定制等关键环节。进一步,文章分析了其高级特性如主题管理、状态持久化及与 MVVM 框架的集成方式,最后总结了在实际项目中应用 Avalon

领导者的自我关怀:应对挑战与压力的关键

### 领导者的自我关怀:应对挑战与压力的关键 在领导他人的过程中,我们常常会遇到各种挑战和压力。这些挑战不仅来自于帮助他人改善状况时的不确定性,还来自于领导工作本身所带来的各种压力。因此,学会自我关怀对于领导者来说至关重要。 #### 帮助他人的挑战 在帮助他人时,我们可能会遇到一些难以应对的情况。有些人会将自己视为受害者,总是消极对待一切,期望最坏的结果。他们没有改变现状的意愿,这会让我们陷入救援者的角色中无法自拔。一旦我们发现试图帮助的人有这种受害者心态,或许就该建议他们寻求专业帮助,然后我们适时抽身。 帮助他人改善状况时,成功的衡量标准往往难以确定,而且具有很强的主观性。干预措施

【SMA模型在LS-DYNA中的实现】:关键技术难点与解决方案

# 摘要 本文围绕形状记忆合金(SMA)材料模型在LS-DYNA中的仿真建模展开系统研究,介绍了SMA材料的基本力学行为与本构模型的数学表达,重点分析了Tanaka模型与Liang-Rogers模型的构建原理。文章详细阐述了SMA材料模型在LS-DYNA中的实现过程,包括用户材料子程序(UMAT/VUMAT)的开发流程、编译调用机制以及仿真结果的验证方法。针对仿真过程中存在的数值稳定性、热-力耦合复杂性等关键技术难点,提出了相应的优化策略。结合典型工程应用案例,如智能结构变形控制、汽车冲击能量吸收及航空航天可变形翼面设计,验证了模型的有效性与适用性。研究成果为SMA材料在多物理场协同仿真中

【MATLAB非线性效应仿真突破】:克尔效应与色散影响全图谱

![【MATLAB非线性效应仿真突破】:克尔效应与色散影响全图谱](https://d3i71xaburhd42.cloudfront.net/223cf2489c613e15103c9351ec8b636f5413f445/40-Figure4-1.png) # 摘要 本文系统探讨了MATLAB在非线性光学仿真中的关键应用,围绕非线性光学效应的理论基础、数值建模方法及仿真实验展开深入分析。首先介绍了非线性光学的基本概念与核心效应,重点剖析了克尔效应与色散效应的物理机制及其数学描述。随后,详细构建了基于非线性薛定谔方程的数值模型,并采用分步傅里叶法在MATLAB中实现仿真求解。通过典型仿

动态目标成像中MUSIC算法性能评估与优化:实测数据对比(含Matlab仿真)

![MUSIC算法](https://rtklibexplorer.wordpress.com/wp-content/uploads/2021/11/image-1.png) # 摘要 MUSIC算法作为一种经典的高分辨率波达方向(DOA)估计方法,在动态目标成像中具有广泛应用。本文系统阐述了MUSIC算法的理论基础,包括信号模型、子空间分解与谱估计原理,并分析其在动态场景下的适应性。通过仿真与实测数据验证,评估了算法在不同快拍数、信噪比及多目标运动模型下的性能表现。研究进一步探讨了MUSIC算法的优化策略,涵盖子空间估计改进、压缩感知结合以及面向动态目标的自适应设计。最后,本文展望了深