智能AI
morning
证词的形状:口述历史档案比较的可扩展框架
2026-05-23
1 阅读
Itamar Trainin, Renana Keydar, Amit Pinchevski
arXiv:2605.21623v1 公告类型:新 摘要:大屠杀研究的研究人员经常区分幸存者口头证词的两种风格:南加州大学大屠杀基金会的采访倾向于遵循结构化的、采访者引导的格式,而耶鲁大学福图诺夫视频档案馆通常倾向于更自由、开放式的风格。这种区别影响了学术研究和后来档案的发展。在这项研究中,我们通过对两个馆藏的 1,600 多个证词进行大规模计算分析,批判性地检验了这一说法。利用话语分段、主题建模和基于大语言模型 (LLM) 的分析,我们通过主题连贯性、访谈者-幸存者动态和问题类型的分布来量化证词的“结构化”水平。我们的结果总体上证实了早期研究中发现的结构差异,同时也揭示了这些集合之间的显着重叠,无论是在个人访谈中还是在常见的叙述模式中。这使得经常应用于这些口述历史的简单的“结构化与自由形式”二分法变得复杂。除了重新审视大屠杀研究中的基本主张之外,我们的工作还为比较语料库分析提供了一个可扩展、可复制的框架。作为概念证明,它为数字口述历史、叙事分析和公民科学注释平台的设计提供了更广泛的应用。