大数据背景下的可拓智能创新 ——李兴森、李爱红、施美
发布时间:2018-09-14 分享到:

中国企业界权威杂志《中国质量》第二次发表"可拓学专栏"(2018年9月总447期)。目录如下:

1、滴水穿石40载——访中国原创的学科可拓学创立者蔡文(《中国质量》记者陈晓华)

2、可拓学从无立锥之地到走出国门——对话蔡文

3、大数据背景下的可拓智能创新——李兴森、李爱红、施美

想了解可拓学详细情况见

“可拓创新大课堂”


·  正  ·  文  ·  来  ·  啦  ·


大数据背景下的可拓智能创新

——李兴森、李爱红、施美


面对快速变化的网络信息环境与更加迫切的创新需求,智能化创新理论与方法如何支撑?大数据  及网络信息技术为创新机理的科学研究准备了条件,基于作为人工智能的基础学科之一的可拓学理 论,研究创新过程中数据、信息与知识的基元化表示、拓展、变换的方法与技术,以网络资源补充 人脑知识的局限性,以流程化的可拓创新方法实现创新策略的辅助生成,在一定程度上破解创新过 程的“ 黑箱困境,有效提升个体和团队的协同创新能力。


随着信息技术的发展,互联网、数据挖掘、信息系统等正在改变着创新的环境,大数据与人工智能技术为创新带来了新的机遇。海量互联网信息的背后,隐藏着创新方案生成的几乎所有原料,从大数据中挖掘知识进行创新是未来的必然趋势。创新活动正转向以用户为中心、以社会实践为舞台、以共同创新和开放创新为特点的用户参与创新2.0模式。在此模式下,将积累大量数据、信息和知识,信息及知识的海量性导致创新的复杂性、系统性进一步提高,从全球创新格局和趋势来看, 国际科技合作愈发密切,价值链各方信息与知识的协同创新能力越来越重要。企业研发活动的多学科、多元化和网络化对创新个体的信息存储、处理、分析等能力提出了更高要求。

大数据背景下传统的创新模式正面临严峻挑战,主要包括:

1)网络环境下创新过程中的黑箱问题。制于目前的研究工具和能力,创新方案生成的过程仍然是一个黑箱,这使得有关创新思维机制的研究难以建立在科学基础之上。借助网络环境这一外脑,通过数据、信息与知识的智能涌现等,使人们摆脱传统习惯思维的控制,找到更系统、全面的创新路径,这是突破创新瓶颈的关键之一。

2)创新方案生成的解空间问题。创新策略的生成其实有一个很长的酝酿期,看似天马行空的创新思维背后,是否存在一定的规律?在获取的创新方案以外, 是否存在更优解?如何借助网络信息集成和可拓变换方法,得到所有可能的解空间?

3)创新方案智能生成的知识完备性问题。智能化生成创新方案的充分必要条件是什么?通过计算机模拟生成创新策略的信息、知识完备性模型如何构建指导数据处理的实践?

由于创新活动的复杂性已远远超越了个人、单个企业或机构的知识能力范围,快速变化的科技环境与创新需求迫切需要有相应的智能化创新理论与方法支撑,智能创新技术成为亟待开展的重要课题。


一、可拓学与可拓智能创新简介

可拓学于1983年由我国学者蔡文创立。它是一门用形式化研究事物拓展与变换的规律与方法,并用于解决矛盾问题的新学科。可拓学探讨矛盾问题智能化处理的基本理论与基本方法,  研究处理矛盾问题的创意和新产品、新项目的创意及其应用,是矛盾问题智能化处理的基础学科之一。可拓学研究者经过30余年的努力,建立了可拓学作为一门学科的理论体系和方法体系,开展了在信息、工程和管理等领域的应用研究;从一个人建设成一支囊括海内外的研究队伍——可拓学科学共同体, 并在此基础上开展了国际化和社会化的工作,逐步进入社会、走向世界。

互联网、物联网环境下快速积累的大数据为创新智能化研究带来了新的机遇。可拓学以形式化模型描述问题,通过拓展变换及关联函数定量分析获取系统性创新方案的优势,正为创新管理研究提供新的思路。近年来,可拓学在工程、管理等领域的成果向人们展示了其作为创新方法论的良好应用前景,未来将为数据、信息、知识的融合提供一套新方法,在大数据到创新方案之间架设一座智能化桥梁

可拓智能创新的含义:利用数据挖掘、机器学习等智能技术,基于可拓学理论与方法,从海量数据中获取与创新目标相关度高的信息和知识,构建基元库与可拓知识库,通过流程化、形式化的多维度拓展、变换、评价,以人工智能手段人机交互,系统化生成创新策略的过程,称为可拓智能创新。

可以说,可拓智能创新是可拓创新方法与人工智能相结合,智能化处理矛盾问题、生成创新策略的方法, 它有6个主要特色:

• 基元集成提供创新素材,弥补人脑信息与知识的不足;

• 交互式:人机交互,取长补短;

• 数字化:通过数据挖掘与机器学习等技术从大数据中获取隐含的信息、知识与模型;

• 流程化:创新策略生成通过建模、拓展、变换和评价4个关键步骤实现,输入、输出和处理过程可固化、可持续优化;

• 可解释性。与神经网络等方法获取的结果相比, 产生的方案结果有较强的可读性,可以跟踪生成的主要策略与基元库间的联系;

• 通过数据挖掘等信息技术,从各类数据中获取信息和知识,将获取的多元知识与人的经验知识相结合, 利用智能手段发现多元知识中蕴含的深层知识和规律。这些规律和知识是从大量知识和信息中通过多次集成、交互产生的,生成的创新策略和方案往往更新颖、更实用。


二、 可拓智能创新的基本思路

1.大数据环境下可拓智能创新的完备性理论。

网络环境下,大量的信息和知识成为创新的重要资源,同时也产生了信息爆炸和知识过载等问题。研究创新所需的信息、知识的类型、结构、组成等,构建创新所需的信息、知识的完备性理论,为有效利用各种背景信息和经验知识,生成管理创新方案准备条件。该研究将为如何利用知识管理与数据挖掘等新技术在网络环境下生成创新策略所需的素材提供理论指导,解决创新过程的信息和知识输入问题。

2.多维信息融合的基元库构建方法。

基元将信息表达为(对象 属性 量值)的三元组形式,构建问题描述模型。

以基元形式化表达信息的方式为:

其中,Object)表示某对象(物、动作或关系词),1c2…,cn表示对象On个特征,v1v2…,vn表示对象O关于上述特征的相应量值。利用本体技术拓展基元理论,研究基元本体的表达、存储方式, 实现创新信息与知识的智能存储,拓展面向行业应用的创新素材库构建方法。以物元为例的智能创新基元库模型示意图如图1所示。

可拓智能创新的基元构建模型(以物元为例)

3.可拓智能创新的策略生成理论。

针对特定问题和创新目标,当相关数据、信息与知识达到足够数量时,创新方案必然隐含其中,只是我们一时无法识别其关键创新路径。通过探索网络环境下数据、信息与知识集成创新的基本规律和方法,挖掘创新方案生成背后的信息、知识融合和变换的机理,设计算法,通过流程化的步骤循环,系统性获取创新策略。可拓智能创新的框架图如图2所示。

可拓智能创新的框架示意图


三、大数据环境下可拓智能创新的实现路径

由于条件限制较大,对创新思维过程的“黑箱”通过生理扫描等手段进行正面研究,难以观察大数据与知识的输入情况。以各类网络信息资源为外脑,用数据挖掘、复杂性模拟等技术方法弥补人的有限能力,从“黑箱”的外围入手,从人机交互的角度对接人工智能领域的研究成果,开辟新的创新方案生成路径,能从更宏观的层次解读创新策略生成的机理。

采用设置规则用推理方法研究创新机理有一定局限性(因为设置规则的能力是有局限的),通过运用网络信息时代的新理论、新技术,以本体技术和可拓学基元存储信息与知识、以智能体模拟仿真技术实现智能涌现、用可拓变换理论设置初始路径,最后用知识多次挖掘的方法从数据和信息中(以基元库素材作为输入,结果作为输出)挖掘规律,与初始路径对比分析,解读创新策略生成的机理,反馈信息与知识的完备性,形成良性循环。主要实现路径如下:

1. 对知识管理、数据挖掘与创新方法文献进行系统、全面的对比研究,设计基本思路,融合本体技术、可拓学理论和智能知识管理理论,明确信息、知识收集的范围、方向、收集方式等。

2. 以可拓集合理论从系统角度进行创新宏观路径研究,以基元理论从微观分解的角度对创新过程进行模拟仿真、解剖研究。将本体技术和基元理论相结合,借助网络信息收集和web挖掘构建基元库,以可拓数据挖掘方法获取创新过程中的信息输入、输出的信息与知识。

3. 对基元库及知识库系统模拟应用案例及可拓学典型的创新案例进行分析、归纳,总结基本规律和方法, 并通过案例检验理论的有效性。

4. 定性研究与定量研究相结合。以关联函数、数据挖掘和模拟仿真等作为定量研究工具,采用知识管理手段对创新知识库进行挖掘和特定目标下的创新策略生成模拟。以开放型专家访谈、参与性或非参与性观察、文献分析、个案调查等作为定性研究工具,发散与收敛交替使用,通过人机交互挖掘创新策略生成的路径。

5. 构建可拓智能创新的理论与方法体系。开发原型系统,通过试用来验证理论方法的有效性。


四、客户流失转化的应用案例

增加客户粘性、预防客户流失是一项重要工作。客户流失预防目前主要依据个人经验,维护的客户数量有限,服务存在明显的滞后性。大数据时代,利用基于可拓学的智能创新方法,可以获得一套智能化的解决方案。在收集客户注册信息、系统使用信息和缴费、投诉信息等基础上建立集成的数据仓库,设定、抽取主要属性及标签数据,构建智能化分析转化模型,系统主要的服务功能包括:

• 客户流失预测。提前12个月预测即将流失的客户,列出流失倾向性高的客户名单并分类。

• 客户特征分析。对即将流失客户的特征进行分析、解读。

• 客户流失预防。通过数据挖掘手段得到流失客户转化的具体措施,如对某类客户采取某种转化措施,流失概率会降低多少百分点等。

系统的实现共分6个步骤:

第一步:挖掘客户分类规则,读入规则集。

See5决策树软件为例,初始规则集以文本文件的 形式保存在.out文件中,规则格式如上面例子所示,其中,rule 2中的198表示的是训练集中符合该规则的记录条数,14表示训练集中不符合该规则的记录条数,预测准确率=198141/19820.925,提升度lift 2.7 = 预测准确率/训练集中该类出现的相对频率。将分类规则依次读入数据库,存入规则表中。

第二步:规则集预处理。

剔除重复读入过程中产生的相同规则,建立关键词全文索引等。

第三步:设定挖掘参数。由用户设定如下参数:

1.类别选择:选择条件类别和目标类别,如由class AclassB转化的规则等。

2.设定规则重合度,即“规则内容相同的条数>= ,如示例中rule2rule3中有POINTS  <=  6 92 < 使用时间长短 <= 7952条相同。

3.设定规则差异度,即规则内容不相同的条数<=_条,如示例中rule2rule3中有是否使用随身邮服务1条规则前件的值不相同。

 设定预期转化率, “可拓规则预期转化率>=_%,应用可拓规则预期的转化率:

tTA符合转化规则的记录数/规则集中所有满足前件条件的记录数。

第四步:规则挖掘。

在规则库中寻找规则重合度和差异度符合条件的规则,通过置换变换、增删变换及组合变换等产生转化策略的规则输出。

第五步:规则评价指标计算。

为评价可拓规则的实用性和新颖性,分别计算预期转化率、支持度和可信度等指标。

第六步:显示结果报告。

挖掘结束提供转化规则列表及挖掘结果总结报告。 某公司利用该技术,对大量的收费邮箱用户流失进行分析,将用户分为现用用户、冻结用户和流失用,并预测用户流失类型,得到了200余条规则,从中进一步挖掘出不同用户之间相互变换的策略,应用后该类客户流失率显著降低。


小结

本文分析了大数据背景下创新环境的改变,提出了可拓智能创新的概念与体系,分析了其特点,并给出了实现的技术路线和方法。可拓学以形式化的方法辅助创新,不是把极其富有创造性的活动呆板化,而是立足于弥补人的思维灵感难以捕捉、可遇而不可求的不足,提高创新的效率和质量。大数据环境下通过人机交互,有可能从一定程度上使创新方案生成更为智能化。将可拓学理论与大数据相结合,以人工智能技术为构建基元和方法库,弥补大数据环境下个体知识处理能力和创新方法的不足。可拓智能创新有广阔的研究空间,有望形成大数据环境下具有东方特色的智能创新方法论。


(作者单位:广东工业大学可拓学与创新方法研究所、山东英才学院商学院、斐戈集团股份有限公司)


 中国企业界权威杂志《中国质量》2018年9月总447期可拓学专栏第42-46页可


Top