商业分析硕士实践:数据科学如何用于社会公益【深圳MBA资讯网】 
最新报名:
6小时前,深圳市**投资发展有限公司 总经理 加入企业投资总裁班,6小时前,东莞**科技控股有限公司  执行董事 加入资本运营作总裁班,6小时前,深圳市*科技有限公司 总经理 加入高级工商管理(EMBA)总裁班,3小时前,惠州***实业有限公司 总经理 加入工商管理(EMBA)总裁班,3小时前,惠州**科技有限公司 董事长 加入工商管理(MBA)总裁班,1小时前,深圳***金融集团有限公司 董事长 加入PE私募股权投资总裁班
商学院banner图
商业分析硕士实践:数据科学如何用于社会公益
发布时间:2022-04-08 14:58:16

商业分析硕士实践:数据科学如何用于社会公益
机器学习系统根据给定的数据创建规则。如果数据有偏差或不完整,则规则将存在根本缺陷。这些类型的数据偏差会破坏机器学习模型: 确认偏差:结果证实了现有的假设和偏见;相关偏差:歪曲变量会导致错误推断;样本偏差:训练集中的缺陷导致数据驱动模型出现错误;刻板印象偏差:不具代表性的训练数据导致模型中的错误相关性;数据偏差不足:样本数据集太小而无法产生准确的假设;系统价值扭曲:收集和组织数据的错误导致测量偏差。


技术继续改变着我们的世界,但技术本身并无好坏之分。数据科学和其他技术创新是造福人类还是让我们的生活更加困难,完全取决于我们自己。
数据科学家在以可以帮助有需要的人的方式应用先进的分析工具和技术方面发挥着主导作用。数据科学领域在现代生活的各个方面发挥着越来越重要的作用。与其他行业的人一样,数据科学家有责任贡献他们的技能和知识,为他们所在社区和世界各地的人们服务。


数据分析为威胁不同人群健康、安全和福祉的严重问题找到切实可行的解决方案的潜力与日俱增。本指南考察了使用高级数据分析使世界变得更美好、更健康、更安全的个人、公司、组织和政府机构。


哪些类型的数据用于社会公益?
用于服务公众需求的数据必须可供科学家访问,而无需版权、专利或其他限制用于非商业目的的数据。Towards Data Science 描述了“开放数据”的特征:
• 数据使用国际公认的分类进行结构化,例如国际标准化组织 (ISO) 的 ISO 3166。
• 数据使用非专有文件格式,例如逗号分隔值 (CSV) 和 JavaScript 对象表示法 (JSON)。
• 可以使用基于标准的通信渠道访问数据,包括基于 JSON 的统计数据和元数据交换 ( SDMX-JSON )。
• 数据伴随着完整且完整地描述它的元数据。
互联网上免费的许多类型的数据不开放,因为它们的重复使用受版权和其创建者应用的其他限制。但是,非营利组织和其他出于正当理由应用数据的组织通常可以根据要求获得不受限制的访问权限。


数据科学家如何应用数据为公众服务
布隆伯格指出,对于许多技术人员来说,所有科学本身都被认为是“好的”,但该科学的好处往往分布不均。例如,算法广告形式的机器学习已经为私营公司创造了数十亿美元的利润,但该技术在公共部门取得的成就要少得多。
社会公益数据科学的目标是将新分析技术的力量集中在缺乏私营公司“重要市场力量”的人们面临的严重问题上。数据科学不是依靠收集的数据来解决单一的社会问题,而是允许为其他目的收集的数据用于模拟与公共卫生和福利相关的问题。


• 共享数据资源。社会公益基金会数据科学基金会等非营利组织为研究人员提供开放数据集,这些数据集适用于与医疗保健基础设施、入学率、空气质量和其他公共利益相关的问题,如《斯坦福社会创新评论》中所述。
• 创建一个整体数据生态系统。共享数据是创建开放平台以确保数据具有预期的社会影响的第一步。社会研究的数据生态系统包括保护数据的政策、进行有效分析所需的技能以及作为研究预期受益者的公共组织的能力和局限性。
• 国际援助透明度倡议。国际援助透明度倡议 (IATI) 成立于 2016 年,是一个非营利组织,旨在促进数据资源使用的透明度和开放性,以帮助发展中国家。其成员包括政府、多边机构、私营企业以及为高危人群收集和使用数据的发展和人道主义组织。


用于促进公共卫生和福利的数据类型
数据科学家必须将真正开放的数据与使用限制共享的数据区分开来。Pan American Journal of Public Health 上的一篇文章“开放数据和公共卫生”解释说,例如,来自政府机构和公共卫生部门的大部分数据都无法修改。特别是,在共享公开的公共卫生数据之前,研究人员必须权衡研究的潜在收益与私人健康数据公开的风险。
• 非营利数据。非营利组织可以像私营企业一样将数据分析技术应用于他们在运营过程中收集的信息。Frye Institute of Education 描述了对非营利组织最有用的数据类型,其中包括内部绩效指标和项目管理效率。


• 公共部门数据。 正如德勤解释的那样,以有利于公众的方式应用公共数据的主要责任落在政府机构的首席数据官 (CDO) 身上。政府机构收集的数据与住房、医疗保健、教育和国家安全有关;它包括人口普查数据、劳动力和就业信息、财务信息、天气数据和地理信息。
• 组织和标准化数据。现代数据分析技术提高了社会和经济预测的准确性,但政府决策者难以获得他们预测模型所需的数据。《技术预测与社会变革》杂志提出了一个框架,可帮助机构从可靠来源以与其建模架构兼容的格式定位和应用社会经济数据。


受益于数据分析的组织类型
数据科学改善了难民安置过程;帮助加州干旱地区的供水区节省资金;并将有需要的人与他们有资格获得的食物、住所、医疗保健和其他计划联系起来。洛克菲勒基金会牵头的一个团体承诺在五年内投入 5000 万美元,以促进数据科学在社会影响项目中的应用。
该集团最初的 2000 万美元投资授予了DataKind,其目标是为为人类服务的组织提供与大型企业相同的高级数据分析访问权限。以下组织是旨在帮助有需要的人的数据科学项目的受益者:
• 瑞士的移民官员使用斯坦福大学和苏黎世联邦理工学院的研究人员开发的一种算法来改进将入境难民安置在他们最有可能找到工作的社区的过程。
• DataKind 通过使用数据分析更准确地预测水资源需求,帮助加利福尼亚的 Moulton Niguel 水区节省了超过 2500 万美元。改进后的预测使该地区不必使用昂贵的水车来运输它不需要的水。
• 好处 Data Trust帮助需要食物、住房或医疗护理的人们连接到公共服务。数据分析帮助该集团处理了超过 930,000 份申请,为有需要的个人和家庭带来了 70 亿美元的收益。


数据科学如何造福有需要的人
数据科学家的工作影响着他们所在社区和世界各地的人们。例如,无家可归影响世界各地的城镇,但其原因因地而异。正如 Gartner 报告的那样,社区技术联盟(CTA) 应用数据科学来更好地了解每个社区无家可归人口的当地特征以及可用于满足他们的食物、住房和医疗保健需求的资源。
数据科学如何改善我们最需要的邻居的生活的例子从全球项目到本地项目:
• 联合国难民署 UNHCR 报告称,截至 2019 年底,全球有 500 万人被迫流离失所,其中包括 2600 万难民,其中约一半未满 18 岁。UN Global Pulse 与 UNHCR 合作开展社交媒体活动,人们更容易接受作为东道社区的服务。


• N. 可持续发展目标 ( SDG )为社会公益的数据科学设定了标准。这17 个目标的范围从消除贫困到促进“和平和包容的社会以促进可持续发展”。Act Now 机器人旨在帮助个人确定为实现可持续发展目标做出贡献的最佳方式。
• 德勤介绍了美国住房和城市发展部 (HUD) 如何与当地政府机构合作,应用数据科学来发现对抗无家可归的最有效方法。一个例子是一个案例管理系统,它结合了数据分析和数字技术来跟踪、监控和支持人们过渡到无家可归的三个阶段:处于危险中、目前无家可归和在家中但需要帮助才能留下。


将数据科学用于社会公益的公司
2018 年,在线营销公司 EveryAction 发布了一项调查结果,该调查发现90% 的非营利组织收集了有关其运营的数据,但只有 5% 表示他们的决策始终是数据驱动的。非营利组织缺乏从他们收集的数据中受益所需的时间、资源和专业知识。
许多数据科学公司正在加紧向其工作造福公众的非营利组织提供服务。以下是公司将数据科学应用于社会公益的示例:
• Qlik销售一个数据分析平台,大公司使用它来提高其业务流程的运行效率。该公司已承诺将其技术提供给致力于建设一个更可持续的世界的非营利组织。Qlik 项目是为非营利组织创建一个平台,用于提高其社区的数据素养。


• IBM Science for Social Good汇集了为 IBM Research 工作的科学家和工程师以及非政府组织 (NGO)、政府机构和非营利组织的主题专家。项目包括用于联合国开发计划署 (UNDP) 可持续发展项目的自然语言处理算法,以及通过 Neighborhood Trust Financial Partners 为低收入者提供的个性化财务建议。
• 截至 2019 年底,万事达卡的包容性增长中心已与 55 个研究机构合作,并参与了影响 30 个不同国家超过 150 万人的计划。其努力包括针对肯尼亚微型商家的培训计划,另一个培训计划它将埃及的工人从现金转换为更安全的数字钱包,另一个将数据科学专业知识带到了新奥尔良以及美国其他城市服务不足的社区。


科技公司如何与公共服务组织合作
正如哈佛商业评论所描述的那样,从现代资本主义的早期开始,企业就一直在寻求为公共利益做出贡献。18 世纪的经济学家和哲学家亚当•斯密写道,我们与生俱来的道德自然会迫使我们创建一个公正和谐的社会,在其中生活和开展业务。
作者 Howard W. Buffett 和 William B. Eimicke在他们的《社会价值投资》一书中描述了在私营企业、政府机构和致力于促进公共福利的非营利组织之间建立有效伙伴关系的五个方面:
• 建立跨部门合作伙伴关系,以制定一个流程,帮助多元化但互补的组织协调他们的努力并利用他们的比较优势。


• 与领导层合作,以促进管理跨越各个参与组织的分散团队中的人员。
• 通过建立一个特定的场所来整合利益相关者,以灌输永久社区的感觉并巩固基于场所的共同所有者之间的长期关系。
• 通过为公共数据项目开发融资组合以分散风险并汇集可用资金,确保项目融资。
• 以协作方式定义成功,以便以符合合作伙伴和利益相关者的目标和原则的方式衡量社会影响项目的绩效。


处于社会公益数据前沿的数据科学家
最广泛的数据科学家网络之一,由英国艾伦图灵研究所运营,与企业、大学、政府机构和非营利组织合作开发预测算法以支持医疗保健决策、机器学习在儿童社会关怀中的伦理,以及类似的努力。
以下科学家是应用数据科学造福社会的主要实践者:
• 李飞飞是斯坦福大学计算机科学教授,也是 AI4ALL 的创始人,这是一个鼓励人工智能 (AI) 多元化和包容性的非营利组织。她和她的团队努力克服机器学习和其他人工智能算法中可能存在的偏见,这些偏见是由不代表系统打算服务的人群的开发团队造成的。
• Paul Duan创立了Bayes Impact非营利组织,支持由公民为公民设计和建造的“公民主导的公共服务”。该组织与美国司法部和加利福尼亚州总检察长合作创建了 URSUS,这是一种检查警察使用武力的工具,旨在恢复警察部门与其所服务的公民之间的信任。
• 非营利组织Delta Analytics的创始人和Google Brain的研究学者Sara Hooker建立了一个由 90 多名数据科学家组成的社区,他们自愿提供服务,帮助非营利组织从数据科学的应用中受益,以实现其公共服务目标。


社会公益数据科学资源
• InsideBIGDATA, “将数据科学用于社会公益” ——发现旨在促进公共福利的数据科学项目示例,包括org和 MIT 媒体实验室的Ginger,它提供 24/7 的心理健康支持。
• Data Science for Social Good, Resources from the Data Science for Social Good Fellowship — 查找支持数据科学研究工作的工具和数据集,包括过去项目的源代码和同行评审的出版物。
• Inside Angle,“AI Talk:AI for Social Good” ——了解微软研究员 Lester Mackey 在 2020 年机器学习国际会议上的演讲中描述的资源。


社会公益数据分析师
有兴趣运用他们的技能和经验来帮助有需要的人的数据科学家必须认真对待他们的项目,以确保他们最终不会弊大于利。正如 Towards Data Science 解释的那样,数据分析师在印度北部一个小村庄的工作展示了成功完成公共服务项目所需的步骤。
• 在确定村民面临的问题之前,团队必须了解村里的人们和他们的生活方式。
• 研究人员必须确保他们的工作不会过度扰乱村民的日常生活。
• 该团队使用两个框架来观察和解释村民的环境、活动和互动。
• 该团队开发了几张地图和图表,以识别村民遇到的数据分析可以缓解的问题。
• 只有在完成准备步骤后,团队才开始收集和分析数据。结果是改善了村里家庭获得清洁用水的机会。


在以公共为重点的数据科学计划或组织中做志愿者
许多组织使用数据分析技术开展计划,以解决影响社区成员的问题。为社会公益项目招募志愿者数据分析师的最受欢迎的组织如下:
• DataCorps招募数据科学家作为志愿者为非营利组织从事长期项目的团队成员,这些组织的努力为公共福利做出贡献。这些团队包括一名项目经理、一名数据大使和两名 DataCorps 数据专家,其中包括一名代表、一名项目负责人和两名来自合作伙伴组织的数据专家。


• 数字人道主义网络(DHN) 提高了非营利组织和公共机构对越来越多致力于帮助有需要的人的技术组织的认识。虽然该组织不再直接运营促进数据科学造福社会的项目,但它继续为人道主义组织提供数据分析专业知识的来源。
• Code for America汇集了技术专家、政府数据专家和社会正义活动家,共同致力于“帮助政府为最需要的人服务”的项目。Code for America 帮助创建的工具之一是Clear My Record,这是一款帮助人们在一段无犯罪生活后密封或清除犯罪记录的应用程序。
• Thorn由 Ashton Kutcher 和 Demi Moore 于 2012 年共同创立,帮助打击儿童性交易。所有 50 个州和加拿大的执法机构都使用该组织的Spotlight工具来识别人口贩运受害者并协助调查和起诉贩运者。


参加数据分析比赛
数据科学家寻求贡献其技能以造福公众的一种常见做法是参加由私营公司和组织赞助的众多编码竞赛或“黑客马拉松”之一。竞赛的目标是设计公共机构和非营利组织可以应用的解决方案,以更好地为组织所针对的有需要的人群提供服务。
以下是赞助数据分析比赛的团体示例:
• Kaggle为数据科学家提供免费访问超过 50,000 个公共数据集和 400,000 个公共笔记本的权限,用于运行机器学习代码。Kaggle 赞助的比赛包括分析全球非营利组织 CDP 汇编的数据,以确定与环境和社会问题相关的关键绩效指标 (KPI)。
• 国际数据分析奥林匹克(IDAO) 赞助了一项年度活动,数据科学家团队在该活动中竞争创建机器学习模型和资源高效算法来解决现实世界的问题。2020 年的比赛已接近最后一轮;它需要使用模拟数据来预测空间物体的位置,以保护轨道卫星。
• DrivenData将数据科学和众包相结合,创造了解决世界各地人们面临的最严重社会挑战的竞赛。比赛通常持续两到三个月,并要求创建最有效的统计模型来解决困难的预测问题。


社会公益数据分析资源
• Data Science for Social Good Foundation, Projects — 浏览由公共机构和非营利组织赞助的数十个数据科学项目,例如世界资源研究所、联合国儿童基金会创新办公室和 Covid Act Now。
• HData Systems,“数据科学将如何帮助促进社会发展?” — 了解支持使用数据分析、机器学习和其他技术来帮助非营利组织和政府机构的计划。
• Bridgespan Group, Stories of Impact - 发现数据科学志愿者为直接解决美国和世界各地气候变化影响的解决方案做出贡献的多种方式。


为社会公益以道德方式使用数据的原则
没有一套数据伦理原则适用于科技公司和其他组织如何使用和保护他们收集、存储、分析和共享的数据。The Conversation 发现,许多大型科技公司没有自己的数据道德准则。代替本土道德准则,这些公司依赖无牙的第三方道德倡议。因此,道德违规者不会面临重大后果。已经制定了自己与人工智能运营相关的道德原则的科技巨头包括谷歌、微软和IBM。
数据的道德使用包括五个方面:
1. 隐私权承认客户与数据收集者共享的私人信息成为收集者的财产,但收集者有责任尊重客户的机密性。
2. 治理解决了确保数据准确性和质量以及算法使用合乎道德的责任。
3. 公平性要求在处理数据时考虑并尊重与数据相关的个人。不得以歧视或边缘化社区成员的方式使用数据。
4. 共享利益意味着作为数据来源的人保留对其使用的一些控制权,并有权期望数据的使用将以某种方式使他们受益。
5. 透明度意味着组织将公开他们如何收集和使用数据,并且他们收集的数据不会超过其直接目的所需的数据。这是许多科技公司不愿遵守的领域。


机器学习的公平性、问责性和透明度
正如 UX Collective 解释的那样,在训练机器学习算法的过程中,开发人员有时会将他们的偏见转移到用于训练系统的数据上。这可能导致产生的机器学习引擎歧视社区的各个部分,这有助于使系统性不公正现象长期存在。只要女性和少数族裔在负责设计机器学习系统的技术领域的代表性仍然不足,这个问题就会一直存在。
从机器学习算法中消除偏见的一个问题是,如果系统过于透明,它们就会变得容易“博弈”,因此它们的结果可能会偏向于不公正地支持某些方面。一些人工智能研究人员得出的结论是,机器学习系统所展示的社会责任水平应该基于它的使用方式。例如,用于分发教育、就业、警察保护、医疗保健和其他社会福利的机器学习工具比那些旨在识别人们在浏览网页时看到的广告的工具需要更高级别的道德责任感。


算法责任
算法决策经常应用于处理工作申请、分发社会服务以及确定人们在访问网站时查看的信息类型。当这些算法导致歧视性或不公平的决策时,人们可能会被不公平地剥夺机会和利益。
正如数据创新中心解释的那样,2019 年的算法责任法案试图通过要求大型科技公司评估“高风险自动化决策系统”的影响来解决这一潜在偏见的来源。但是,该立法并未明确定义其适用的系统类型,也未明确定义对消费者数据隐私构成“重大风险”的因素。
传播总监提出了管理算法问责制的三个原则:
• 促进进行持续辩论,以确保受到算法负面影响的任何人都可以参与解决和消除偏见。
• 帮助人们了解识别算法中的偏见的关键问题。随着算法变得更加复杂,这项任务变得更具挑战性。
• 在讨论中包含所有论点,以获得尽可能多的相关观点。算法的危害经常来自人们的分类方式,可能会导致污名化。避免这种内在偏见的唯一方法是允许所有受算法影响的人参与其开发。


数据科学协会行为准则
各种数据科学组织都试图为该领域建立道德规范,但正如 Towards Data Science 所指出的,在数据科学家之间就原则的范围及其与个人自身价值体系的关系达成共识是困难的。为数据科学家制定道德准则的团体包括数据科学家协会和数据科学协会,其行为准则涵盖八个领域:
• 展示能力,包括知识、技能、彻底性和准备
• 明确向客户提供的服务范围并致力于实现客户目标
• 与客户保持定期沟通并让他们充分了解情况
• 保护客户信息的机密性
• 避免利益冲突
• 向潜在客户履行公平和公开的职责
• 坚持向客户全面披露数据和证据的质量
• 避免不当行为,包括欺诈、欺骗、失实陈述和偏见


为社会公益以合乎道德的方式使用数据的资源
• Data & Society,“Algorithmic Accountability: A Primer” ——深入研究设计决策支持算法时必须解决的道德问题。
• Towards Data Science ,“以正确的方式处理数据:数据科学的伦理” ——了解更多关于模糊伦理领域的信息,例如知情同意、数据所有权和数据有效性责任。
• Deon, An Ethics Checklist for Data Scientists — Deon 命令行工具可自动将道德检查表添加到数据科学项目中。


数据科学对公共卫生和福利越来越重要
推动大型科技公司发展的同样先进的数据分析工具在以有效、高效的方式为需要公共服务的人们提供公共服务方面具有同样巨大的影响力。数据科学家拥有宝贵的技能以及运用这些技能造福他们的社区和整个世界的根深蒂固的愿望。他们的贡献仅限于他们的想象力。

版权申明:以上课程知识产权归属主办单位,深圳MBA总裁班研修网仅提供信息展示,而非商业行为 粤ICP备17004821号
免责声明:深圳EMBA总裁研修网部分内容摘自网络,如有侵害您的权益,请联系管理员删除
Copyrights © 2007-2022 mba-sz.com shenzhen MBA edu Cente All rights reserved