人工智能,文化多样性和巨大的“语言包”

Amir Goldberg的整个研究,从一个大家讨论已久的老问题开始:一个公司内部的文化多样性会如何影响公司的整体绩效?公司内部的文化多样性,可以成为一个巨大的优势,通过丰富多样的想法激发创造力,也可能会造成员工之间的分歧,从而阻碍整体绩效的提高。所以,Goldberg想知道,到底会是哪一种影响?

数据

传统的研究方法是,对这个问题感兴趣的研究人员,首先会列出一些他们认为最重要的企业文化的影响因素—比如公司文化是竞争性或合作性的、正式或非正式的。然后将这些因素提炼成一份调查问卷,发送给不同公司的数千名员工。

从收回的调查问卷中,他们将获得一个整齐的结构化的信息列表:比如,员工A认为Google具有竞争力和创新能力,而员工B则认为Walmart是官僚和正式的,等等。

Goldberg解释说,这种方法有两个基本的问题。首先,研究人员会将自己狭隘的文化分类方法强加给原本杂乱无章的系统。其次,很多人实际上并不擅长回答调查问卷。他们会以意想不到的方式解读问卷中的问题,给出他们认为研究人员想要听到的答案,或者因为不知道该说些什么就随意选择一个答案。

Goldberg希望能采取一种不同的方法。他联系了Glassdoor,这是一个求职和招聘网站,公司员工可以在该网站上匿名评价他们曾工作过的公司。Goldberg想知道,当不受调查问卷的选项约束时,人们会如何谈论公司文化?同一家公司的员工是否对公司文化的看法是一致的?如果有不同,是怎样的不同?

团队

Goldberg和两位合著者,麦吉尔大学的Matthew Corritore和加州大学伯克利分校哈斯商学院的Sameer Srivastava,一起在Glassdoor网站上收集到了与492家上市公司相关的跨越了七年多时间的大约共50万条评论。对于Goldberg来说,想要从如此大量且混乱,完全超出了传统调研规模的数据中,提取和分析出关于企业文化方面的评论,就像是大海捞针一样。

Goldberg说,在整个过程中,他得到了斯坦福商学院数据分析和研究计算专家小组 (DARC) 的很多支持,确保了研究团队对数据的访问能够符合Glassdoor提出的要求。此外,对于Goldberg的其他研究项目,DARC还帮助他解决了第三方数据收集的合同问题,构建数据分析所需的内部基础结构,并通过改进数据结构提高了数据的可用性,使很多原本复杂的工作变得更容易。

算法

如果完全依靠人工操作,对50万个Glassdoor评论进行分析将是一项异常艰巨的任务。因此,Goldberg转而使用了一种称为“隐含狄里克雷分布主题建模”的机器学习算法,也就是俗称的词袋模型算法。
 

通过使用词袋模型算法来研究Glassdoor评论,可以帮助我们以一种我们原本无法使用的方式来衡量“文化”这种模糊的东西。
– Amir Goldberg

 
这种算法的唯一限制条件是应该寻找多少个主题。在这种情况下,Goldberg可以先假设有50种相关的文化类型,也许是100种。这个数字可以随着时间的流逝而不断完善,以找到最具解释力的数字。一旦算法知道要查找的主题数,就会扫描每个文档并创建一个巨大的电子表格,用于定义一个单词出现在句子中另一个单词附近的概率。在不需要实际理解这些单词指代意义的情况下,该算法能够将不同的单词簇分类为一个或另一个主题集合。

Goldberg说:“该算法无需人工输入,也就没有掺杂任何人为的理解和判断,而是通过查找倾向于同时出现的单词,归纳推断出不同的话题集合。”

分析

Goldberg和他的合作者首先使用大约一百万个句子训练了该算法,这些句子都包含“文化”或一个近似的同义词(环境,气氛,态度,气候,价值,哲学,信念等)。通过分析这些单词的周围都出现了哪些单词,这项培训提供了一个比较可靠的不同文化类别的模型。然后,研究人员又将此模型应用到Glassdoor每条评论的每个句子中,从而对有关公司文化的讨论进行归类。

这个分析包括了近500家上市公司,因此Goldberg随后又着重研究了两个主要的数据。首先,某公司内部的员工如何评价该公司的文化?大家的看法是否一致?是否认为公司的文化具有足够的多元性?其次,该公司的资产收益率是什么?

Goldberg说:“实质上,我们对任何一家特定公司的文化都不感兴趣。我们希望知道的是公司员工对公司文化的看法是否一致。” 研究结果表明,员工对公司文化的看法分歧较大的公司往往效率较低,而拥护多元文化的公司会更具创新能力。

最后,Goldberg说,人们可能很容易被机器学习所具有的那种似乎无所不知的光辉所吸引。这些工具奇特、有趣且酷。但是,我们也必须要问自己一个最基本的问题—我们为什么需要使用它?

他指出,除了追赶潮流以外,研究学者还应该有一个确实需要使用复杂且通常不透明的算法来探索巨型数据集的研究课题。使用机器学习算法的课题研究可能会吸引到更多的资金和关注,但是确实有必要吗?

Goldberg说:“就我们的研究课题而言,通过使用词袋模型算法来研究Glassdoor评论,可以帮助我们以一种我们原本无法使用的方式来衡量“文化”这种模糊的东西。我们从这项研究中学到的东西,是原本我们根本无法学到的。”

相关文章:一场正在进行中的学术研究革命