如果数据包含在结构化空间数据文件中,则可以将其放置在地图上。您甚至可以使用位置描述(例如 x、y 坐标或地址信息)来映射非空间结构化数据文件(例如电子表格)中的要素。但是如果您拥有非结构化的非空间数据(例如电子邮件或其他形式的文本)该怎么办?
您还可以提取非结构化位置描述文本,例如基于文本的注释或电子邮件中的坐标,并从中创建空间数据文件。
非结构化文本可能包含可放置在地图上的位置参考
什么是非结构化文本源?
数据源通常是结构化的,但也可以是半结构化或非结构化的。
结构化数据是指以专门组织数据的格式存储的文本或 电话号码数据库 其他数据,例如数据库、电子表格或 CSV 文件。结构化数据是高度组织化的,并且通常按数量进行分类。
其他数据源是半结构化或非结构化的。例如,您可能会在结构化程度较低的报告中找到比数据库或电子表格中更明显的半结构化文本。但非结构化数据没有预定义的数据模型或可识别的结构。非结构化数据是无组织的并且更加定性。它由文本或多媒体内容组成。
非结构化文本可能来自不是为组织和
提取数据而设计的信息源。以下是一些非结构化文本源的示例:
Word 文档、文本文件或 PDF 文件是非结构化文 中小企业在审查内容营销机构时应关注的 4 个品质 本源的示例,其中可以包含可由ArcGIS LocateXT组件提取的位置信息。
PowerPoint 或其他演示文件包含分析师可 新加坡电话列表 以提取和绘制的位置信息。
报告是位置信息的常见来源,可以是非结构化的,也可以是半结构化的。
电子邮件是半结构化或非结构化文本的常见形式。电子邮件具有一些内部结构,但无法通过传统的分析软件检索。
网站或博客的 XML 和 HTML 文件可以包含非结构化位置信息,例如按位置列出的财产列表或交通事故等事件位置的动态更新。
照片或其他图像可能包含位置描述。照片可能在许多设置中存储了元数据,包括坐标信息。
Facebook、Twitter 和 LinkedIn 等社交媒体平台生成的数据是非结构化的。还可以扫描聊天、论坛和即时消息中的通信以获取有用的位置信息。
您可以使用 ArcGIS LocateXT组件将来自非结构化数据源(例如上面提到的示例)的信息带入新的空间数据层,进行映射,并逐一添加报表的属性信息。
从非结构化数据源向地图添加位置
您的本地文件夹中可能保存了大量以各种格式保存的非结构化文档。您可能还需要从这些文档中提取空间数据。例如,您想对大部分休闲步道进行维护。您会定期收到骑自行车者、徒步旅行者和跑步者发来的有关路径问题的电子邮件,其中包括日期、位置、维护问题和问题的简要描述,这就是您收集路径维护报告的方式。