Evaluating the Social Impact of Generative AI Systems in Systems and Society
Last updated
Last updated
随着生成性人工智能(AI)系统在文本、图像、音频和视频等多个模态的广泛应用,它们对社会产生了广泛的影响。然而,目前尚无官方标准来评估这些影响,以及应该评估哪些影响。本文旨在提出一个评估生成性AI系统社会影响的标准方法,涵盖基础系统和整个社会的两大类评估。
以往的研究没有充分考虑AI生成内容对训练数据集的潜在影响。虽然AI生成的数据可以用于数据稀缺的应用场景,但它也可能导致数据集质量的下降。此外,现有的评估方法往往依赖于特定的数据集和模态,缺乏跨模态和跨系统的通用性。
本文提出了一个框架,用于评估任何模态的生成性AI系统。首先定义了基础技术系统中可以评估的七大类社会影响,然后在人和社会层面上提出了五个主要的评估类别。这些类别包括信任度和自主性、不平等、边缘化和暴力、权力集中、劳动和创造力以及生态系统和环境。每个子类别都包含了缓解伤害的建议。
本文的创新之处在于提出了一个跨模态的评估框架,不仅关注AI系统本身的技术特性,还关注其在社会层面的广泛影响。此外,本文还提出了一个评估库,供AI研究社区贡献现有的评估,并在ACM FAccT 2023的CRAFT会议上更新。
本文没有进行实验,而是通过工作坊和文献综述来构建评估框架。工作坊邀请了来自工业界、学术界、民间社会和政府的专家,共同讨论和定义评估类别和方法。
由于本文没有进行实验,因此没有实验结论。但是,通过专家讨论和文献分析,本文提出了一个全面的评估框架,为未来在这一领域的研究提供了方向。
本文提出了一个评估生成性AI系统社会影响的框架,强调了在技术系统和整个社会层面上进行评估的重要性。这一框架有助于降低研究者、开发者、第三方审计员和政策制定者参与这些话题的门槛,并为未来的评估研究提供了基础。
本文为评估生成性AI系统的社会影响提供了一个全面的框架,涵盖了从技术基础到社会层面的多个维度。通过专家工作坊和文献综述,本文提出了一个评估库,旨在促进AI研究社区的交流和合作。这一框架不仅有助于理解AI系统的社会影响,也为制定相关政策和技术干预提供了指导。