首页 > 热点专题

周以真:因果推断中大数据与AI如何赋能营销决策

文章作者:来源:www.gfxfaction.com时间:2019-09-27



原标题:周一祯:因果推理,大数据以及AI如何实现营销决策

IT时代实习记者钱一云

作为一个热门词,“数字营销”已成为大多数企业的需求。但大数据和人工智能如何影响决策?它背后的原理是什么?

8月28日,MarTech中国会议2019年在上海举行。在会议上,美国计算机协会(ACM)院士,哥伦比亚大学数据科学研究所(DSI)主任周一祯和IEEE阐述了基于因果推理的大数据和人工智能营销决策。

传统的回归分析只能分析变量的相关性,但不能识别变量的因果关系。但是,对于经济学和企业营销,必须找到影响结果的原因。因此,已经开始出现能够有效识别变量之间因果关系的新因果推理范式。

中国社会科学院信息研究中心秘书长蒋启平在《因果关系与大数据》中写道:“如何从相关关系推断出因果关系是大数据的真正问题。这个问题被称为因果推断,是Apple iPhone 6和谷歌无人驾驶汽车技术的语音识别基础。

例如,年度游泳池交通量和冰淇淋销售量之间存在显着的正相关关系,但它们之间没有因果关系。是因为游泳池中人数的增加导致冰淇淋的销售增加了吗?或者冰淇淋销售增加导致游泳池人群增加?都不是。两者之间的正相关是由天气的常见原因引起的。

一个更模糊和合理的例子是:一个案例表明,阅读科学博客的人越多,他们的科学素养水平就越高,两者之间是否存在因果关系?很多人可能会误以为它,但实际上两者之间可能只有两个双向因果关系。我们无法分辨出阅读科学博客的人越多,他们的科学素养水平就越高,而且科学素养高的人也会喜欢阅读博客。然后,在这种模棱两可的情况下,两者之间的因果关系判断可能不够稳健。

这也导致了一个问题:内生性。在研究门票销售与价格之间的关系时,两者之间存在双向因果关系,票价是内生的。此时,您需要找到合适的变量来替换票价。该变量称为“工具变量”。有必要选择与票价相关且与销售无关的变量作为工具变量,例如油价。

另一个问题是反事实预测。在探讨大学教育和非大学教育对个人收入的影响时,只有通过探索同一个人接受大学教育和不接受大学教育的收入差距,才能准确识别大学教育对个人收入的原因和影响。关系。然而,正如人们不能同时进入同一条河流一样,一个人同时接受大学教育和大学教育的反事实现象也无法被观察到。

因果推断主要基于反事实预测。反事实预测是提出假设如果条件没有建立,将会预测什么。当X建立时Y的结果与X未建立时的Y的反事实结果之间存在显着差异时,变量X被称为与变量Y具有因果关系,反之亦然。在实验中,在其他变量被控制为相同的情况下,实验组和对照组用于模拟X建立并且X未建立。

周一祯举了一个例子来说明因果推断。

例如,召开世界人工智能会议将增加对上海门票的需求。航空公司应如何定价?

原理是这样的:找到影响票务销售的所有变量票价,节假日,人工智能会议,这些变量之间的关系可以写成一个函数,其实最重要的是我们要找到因果关系在功能中。我们可以训练具有大数据和AI的深度神经网络,减少错误,并验证保留数据的结果。

首先,为票价找到工具变量油价。

然后,模拟票价。使用工具变量训练深度神经网络可以最大限度地减少反事实预测误差并验证保留数据的结果模型。最后,会议发现召开会议与票价存在重大因果关系。

因果推理中的大数据的另外两个应用是代表性采样和综合控制。

周一祯以预测选举为例说明大数据和代表性抽样。当美国预测大选时,通常会由第三方机构代表国家公民进行民意调查以预测选举结果。随着大数据的应用,不再需要进行代表性采样并直接采用非代表性的采样结果。经过多层回归和后分层后,每个用户都被解构为分析他们的个体特征,例如生活在18-22岁的纽约的白人男性,居住在纽约的男性,并且可以提取不同类别的特征。在人群中发现了代表性的样本群体。实验发现,这种预测的结果比传统的预测方法更准确。

关于综合控制案例,周一祯谈到了加州99号提案对吸烟的影响。 1998年,加州通过了99号提案,卷烟税增加了25%,人们想通过99提案知道,这将导致吸烟率下降。但是,还有其他因素会影响吸烟率。那么,如何判断是否是第99号提案的原因?答案是将其他49个州组合为一个单独的对照组,而不必将每个州视为一个单独的元素,然后比较加利福尼亚实验组。采用综合控制方法,首先看一下加州的情况,然后看看其他49个州的情况,最后发现加州的吸烟率下降更为明显,这可以归结为第99届的影响提案。

当然,这是一个过去的例子。最近,哥伦比亚大学正在研究一种强大的综合控制方案即使在丢失数据和噪声数据的情况下,也可采用该方案。这种强大的集成控制方案的结果如下。总体控制结果是一致的。它是一个多变量,功能强大的集成控制工具,可以包含更多变量和尺寸。回到搜狐看看更多

负责编辑:

2019-09-06 18: 49

来源: IT时间

原标题:周一祯:大数据和人工智能如何做出营销决策的因果推论

IT时报实习记者钱伟

作为一个热门词,“数字营销”已成为大多数企业的需求。但大数据和人工智能如何影响决策?背后的原理是什么?

8月28日,2019年中国人工智能营销年会(MarTech China Conference 2019)在上海举行。在会上,哥伦比亚大学数据科学研究所(DSI)主任,美国计算机学会(ACM)研究员,IEEE研究员周一祯解释了大数据和人工智能如何根据因果推断做出营销决策。

传统的回归分析只能分析变量的相关性,但不能识别变量的因果关系。然而,对于经济学和企业营销而言,找到影响的原因至关重要。因此,有效识别变量之间因果关系的新兴研究范式“因果推理”开始兴起。

中国社会科学院信息化研究中心秘书长蒋启平在《因果关系与大数据》中写道:“如何从相关性推断因果关系是大数据的真正问题。这个问题被称为因果推断,它是Apple.iPhone 6的语音识别和谷歌无人驾驶汽车技术的基础。“

例如,年度游泳池营业额和冰淇淋销售之间存在显着的正相关关系,但两者之间没有因果关系。是不是因为游泳池里人流增加导致冰淇淋销量增加?或者因为冰淇淋销量增加,导致游泳池流量增加?不,两者之间的正相关是由共同原因天气引起的。

一个更模糊和合理的例子是:一个案例表明,阅读科学博客的人越多,他们的科学素养水平就越高,两者之间是否存在因果关系?很多人可能会误以为它,但实际上两者之间可能只有两个双向因果关系。我们无法分辨出阅读科学博客的人越多,他们的科学素养水平就越高,而且科学素养高的人也会喜欢阅读博客。然后,在这种模棱两可的情况下,两者之间的因果关系判断可能不够稳健。

这也导致了一个问题:内生性。在研究门票销售与价格之间的关系时,两者之间存在双向因果关系,票价是内生的。此时,您需要找到合适的变量来替换票价。该变量称为“工具变量”。有必要选择与票价相关且与销售无关的变量作为工具变量,例如油价。

另一个问题是反事实预测。在探讨大学教育和非大学教育对个人收入的影响时,只有通过探索同一个人接受大学教育和不接受大学教育的收入差距,才能准确识别大学教育对个人收入的原因和影响。关系。然而,正如人们不能同时进入同一条河流一样,一个人同时接受大学教育和大学教育的反事实现象也无法被观察到。

因果推断主要基于反事实预测。反事实预测是提出假设如果条件没有建立,将会预测什么。当X建立时Y的结果与X未建立时的Y的反事实结果之间存在显着差异时,变量X被称为与变量Y具有因果关系,反之亦然。在实验中,在其他变量被控制为相同的情况下,实验组和对照组用于模拟X建立并且X未建立。

周一祯举了一个例子来说明因果推断。

例如,召开世界人工智能会议将增加对上海门票的需求。航空公司应如何定价?

原理是这样的:找到影响票务销售的所有变量票价,节假日,人工智能会议,这些变量之间的关系可以写成一个函数,其实最重要的是我们要找到因果关系在功能中。我们可以训练具有大数据和AI的深度神经网络,减少错误,并验证保留数据的结果。

首先,为票价找到工具变量油价。

然后,模拟票价。使用工具变量训练深度神经网络可以最大限度地减少反事实预测误差并验证保留数据的结果模型。最后,会议发现召开会议与票价存在重大因果关系。

因果推理中的大数据的另外两个应用是代表性采样和综合控制。

周一祯以预测选举为例说明大数据和代表性抽样。当美国预测大选时,通常会由第三方机构代表国家公民进行民意调查以预测选举结果。随着大数据的应用,不再需要进行代表性采样并直接采用非代表性的采样结果。经过多层回归和后分层后,每个用户都被解构为分析他们的个体特征,例如生活在18-22岁的纽约的白人男性,居住在纽约的男性,并且可以提取不同类别的特征。在人群中发现了代表性的样本群体。实验发现,这种预测的结果比传统的预测方法更准确。

关于综合控制案例,周一祯谈到了加州99号提案对吸烟的影响。 1998年,加州通过了99号提案,卷烟税增加了25%,人们想通过99提案知道,这将导致吸烟率下降。但是,还有其他因素会影响吸烟率。那么,如何判断是否是第99号提案的原因?答案是将其他49个州组合为一个单独的对照组,而不必将每个州视为一个单独的元素,然后比较加利福尼亚实验组。采用综合控制方法,首先看一下加州的情况,然后看看其他49个州的情况,最后发现加州的吸烟率下降更为明显,这可以归结为第99届的影响提案。

当然,这是一个过去的例子。最近,哥伦比亚大学正在研究一种强大的综合控制方案即使在丢失数据和噪声数据的情况下,也可采用该方案。这种强大的集成控制方案的结果如下。总体控制结果是一致的。它是一个多变量,功能强大的集成控制工具,可以包含更多变量和尺寸。回到搜狐看看更多

负责编辑:

免责声明:本文仅代表作者本人,搜狐是信息发布平台,而搜狐只提供信息存储空间服务。

周一祯

变量

因果关系

因果

加利福尼亚

阅读()