Evaluating the Social Impact of Generative AI Systems in Systems and Society

阅读总结报告

随着生成性人工智能（AI）系统在文本、图像、音频和视频等多个模态的广泛应用，它们对社会产生了广泛的影响。然而，目前尚无官方标准来评估这些影响，以及应该评估哪些影响。本文旨在提出一个评估生成性AI系统社会影响的标准方法，涵盖基础系统和整个社会的两大类评估。

以往的研究没有充分考虑AI生成内容对训练数据集的潜在影响。虽然AI生成的数据可以用于数据稀缺的应用场景，但它也可能导致数据集质量的下降。此外，现有的评估方法往往依赖于特定的数据集和模态，缺乏跨模态和跨系统的通用性。

本文提出了一个框架，用于评估任何模态的生成性AI系统。首先定义了基础技术系统中可以评估的七大类社会影响，然后在人和社会层面上提出了五个主要的评估类别。这些类别包括信任度和自主性、不平等、边缘化和暴力、权力集中、劳动和创造力以及生态系统和环境。每个子类别都包含了缓解伤害的建议。

本文的创新之处在于提出了一个跨模态的评估框架，不仅关注AI系统本身的技术特性，还关注其在社会层面的广泛影响。此外，本文还提出了一个评估库，供AI研究社区贡献现有的评估，并在ACM FAccT 2023的CRAFT会议上更新。

本文没有进行实验，而是通过工作坊和文献综述来构建评估框架。工作坊邀请了来自工业界、学术界、民间社会和政府的专家，共同讨论和定义评估类别和方法。

由于本文没有进行实验，因此没有实验结论。但是，通过专家讨论和文献分析，本文提出了一个全面的评估框架，为未来在这一领域的研究提供了方向。

本文提出了一个评估生成性AI系统社会影响的框架，强调了在技术系统和整个社会层面上进行评估的重要性。这一框架有助于降低研究者、开发者、第三方审计员和政策制定者参与这些话题的门槛，并为未来的评估研究提供了基础。

本文为评估生成性AI系统的社会影响提供了一个全面的框架，涵盖了从技术基础到社会层面的多个维度。通过专家工作坊和文献综述，本文提出了一个评估库，旨在促进AI研究社区的交流和合作。这一框架不仅有助于理解AI系统的社会影响，也为制定相关政策和技术干预提供了指导。

Last updated 1 year ago