Big Database

Posted: **Sat Feb 08, 2025 4:15 am**

7.2 语义网中的文献分析
可以使用查询语言 SPARQL 检查标有 RDF 的文档，通过搜索条件的特定结构（可链接性），与其他数据库的连接可提供扩展的搜索选项。例如，使用 RDF 记录语料库中提到的所有地名可以链接到地名词典（例如 OpenStreetMap）以确定地理坐标并使用它们绘制地图，例如使用 Google Maps 或 Google Fusion Tables，它们可用于关联记录文本中出现的地名的频率和分布。 DARIAH-DE GeoBrowser 还允许您绘制显示随时间变化的地图。

由于可以在互联网上对文本进行评估，因此所识别的参考文献不仅可从单个文本的角度读取。还可以从相反的方向评估哪些文本引用了特定的参考点（例如特定的引述或地点等）。[35]

7.3 其他学科的数字文献分析
这些文学分析方法最终将被证明远远超出美学和文学研究的问题。按照万维网的基本设计，以这种方式记录的文学文本可供世界各地的任何人访问，因此也可以通过其他学科进行评估。除了历史科学之外，这也可能引起所有其他涉及人类文化问题或人类发展历史的研究领域的兴趣，即生命科学和所有研究认知过程的学科。例如，人们如何体验、感知、描述、表示和交流空间（结构）是所有空间科学的一个重要问题。[36]在文学文本中研究这一点会大有裨益。[37]

尽管文学文本包含并提供了丰富的（不仅仅是文化）知识，但迄今为止，文学在这方面仅得到部分评价。通过在语义网中索引文学文本，其他学科也可以系统地使用他们的数据进行研究工作。

8. 观点
8.1 告别圣经时代
显然，这里考虑的分析文学文本的方法更适合处理大量文本，而不是分析个别作品。计算机程序可以研究大量文本，其规模是单个读者无法掌握的，这对当今文学研究来说是一个有吸引力的挑战。正如弗朗哥·莫雷蒂（Franco Moretti）通过实验指出的那样， [38]从对“一本书”的解释学解释转向对数百篇文本的“远距离阅读”使得新类型的问题成为可能，而这些问题绝不能被归类为与该学科遥远或格格不入的。相反，莫雷蒂的《地图集》最终以一种新的方式让我们更接近“欧洲”小说。[39]

我们希望这样的路径能够让我们更清楚地辨别出文学“系统”的轮廓，也就是文学文本在文化社区整体结构中的作用和运作。文学文本既不是独一无二的，也不是孤立的。经过多次复制，它们同时出现在多处。它们出现在文学传统和当前趋势的背景中，见证了历史事件和发展。他们参与社会话语并且成为决定文本创作和接受以及主题和论证的经济关系的一部分。可以通过这里概述的方法来实现这种在更大的系统背景中文本的锚定或网络化，从而能够并要求对大量文本以及单个文本进行评估。

8.2 文本的网络化
正是那些被认为在文化史上最为重要的不朽的个别文本，似乎具有紧密的系统联系；这既适用于《圣经》，也适用于荷马，既适用于但丁，也适用于《一千零一夜》的故事，既适用于莎士比亚，也适用于乔伊斯。如果评价单个文本的参考概况或联系程度，就可以更准确地确定它与“世界文学”的“无限”文本的关系，以及它与“世界”的指称关系。这可能表明，通过确定各自的互联程度，可以制定新的文学评价标准或确定文本的美学质量的标准。

然而，如果比较联系的质量和强度，就会发现一系列的关系，而不是一系列的价值。还可以对它们进行统计学检验，例如，关于文本接收机制：对于许多读者来说，高度的链接可能对应于高度的连接可能性；反之，连接程度低则可能表示文学结构具有很大的独立性；非常特殊的联系可以表明密封的倾向；抽象的一般特征可以实现广泛的接受度，等等。还有一些以前未解决的考虑因素在这里作为进一步的研究问题出现。最后，元数据（例如单个文本或单个链接的查询频率注册）也可以用于它们的评估，前提是已经在程序中实现了它们的收集。

8.3 旧任务和新任务
通过数据网络进行数字文学分析的概述方法产生了一种关系文学分析，其中根据文本组来评估单个文本的属性，并且根据生产和接收美学与它们所嵌入的系统相关联。与以前一样，分析的重点将放在详细检查文本结构以及使用文学类别捕捉它们上。

这种方法的主要思想之一是使文学文本中传达的知识更加清晰地凸显出来，并比以前亚美尼亚电报数据更加系统地恢复它。一方面，这涉及与文学研究特别相关的知识，例如审美概念和表达形式的迁移；另一方面，这涉及查询文本中描述或涉及的非文学事实背景的可能性，例如确定购买价格关系数据，因为它们与经济史相关，或用于研究气候变化的数据和与医学相关的临床图片的描述。万维网上“网络化”文本的数据，即为自动查询而准备的文本，可以而且也应该被其他学科使用，从而比以前更大程度地挖掘文献的潜力，并使其可用于科学研究。

9. 结论
对于数字化支持文献分析的发展，以计算语言学或语料库语言学已经证实的方法和方式为基础似乎是明智的。与计算机科学的许多其他领域一样，数字文学研究未来将高度依赖自然语言处理的发现和方法。

目前，开发复杂的注释程序或相关查询似乎是基于大型文本语料库进行系统和可验证的文献分析的可行方法。这些分析，特别是在大规模研究中，有助于审查和区分学科的基本评估，例如关于某些文学流派、运动或群体的形成和传播，或关于文学和知识转移的研究。另一方面，越来越明显的是，在对作品的具体内容进行比较评估时，这些方法也可以在单一文本分析领域得到有效利用。

将文本语料库存储在万维网上不仅可以促进其普遍的可访问性。将文本整合到语义网中也开辟了更多的选择：它使得文学文本的多维性能够通过数据链接来表示，从而既可以作为存储介质，又可以作为获取科学知识的媒介。这样的文本表征无疑将拓宽文学科学知识的可能性范围。最后但同样重要的一点是，文学文本与语义网的链接也使得其他对人类发展和人类创造的系统感兴趣的学科能够获取文学文本中包含的知识，而这些知识迄今为止几乎无法被他们评估。[40]

Big Database

教授职位和学位课程的框架

教授职位和学位课程的框架