通过新闻映射隐藏的语言地理

阅读 通过新闻映射隐藏的语言地理 在文章中

在此页面上,您可以了解最新的新闻博客。 我们在此页面上提供最新消息。 通过新闻映射隐藏的语言地理 读给所有关注世界上最新事件的人。 我们只发布经过验证的数据,因此请与我们联系,阅读新闻并获取每日最新信息。 我们感谢您的时间,我们知道不断了解您的重要性,因此我们只为您选择相关,有趣和有用的新闻。 与我们保持联系,您将始终了解世界各地的事件,不要错过重要新闻。 另请记住,我们可以免费阅读和下载MOBI书籍而无需注册。 来自世界着名作家的各种类型的文学选择,从不同年代的新奇发行到文学经典。 根据您的口味选择书籍,下载,发表评论并敬请关注该网站。 Kalev Leetaru在全球新闻报道2017年4月6日至2018年5月4日由GDELT项目地理位置监控的“爱”这个词附近提到的地理位置为我们提供了一个令人难以置信的镜头,可以通过它看到世界。虽然我们经常根据空间域中已存在的信息(例如建筑物地址或GPS坐标)来考虑地图,但书面文字包含大量的定位见解。当我们将全文地理编码与云的力量结合起来分析数以亿计的全球新闻报道以映射新闻语言的隐藏地理时会发生什么?语言与地理有着千丝万缕的联系。每当我们消耗关于我们周围世界的可用信息流时,我们都被提到了位置。特别是新闻媒体充满了定位参考,巩固了我们对太空世界的理解。一篇典型的新闻文章提到了地球上的一个地方,无论是街道地址,地标,城市,州还是国名,大约每80-120字一次。称为全文地理编码器的专业计算机算法能够获取文本文档,如新闻文章,识别所有位置内的提及,并使用全球地名录,上下文和领域知识,如出口的位置消除歧义和翻译文字提到“巴黎,伊利诺伊州“在地图上的一个点。应用于维基百科,这样的算法可以产生两个世纪以来的全球历史动画地图,反映了在线百科全书的真实地理覆盖范围,而不是其嵌入地理标记的更为有限的西方沿海地理。当应用于新闻报道领域时,这种算法尤其强大。推荐福布斯最受欢迎美国十大危险城市在Facebook上流行告别玩具R我们,我们会想念你2011年,我的Culturomics 2.0研究展示了绘制语言语言亲和力的能力,通过简单地映射所提到的所有位置来证明在奥萨马·本·拉登被捕之前的全球新闻报道中,结果是距离他最终被捕的地方仅200公里的地理关系。这些先前的映射工作中的每一个都需要广泛的高度专业化的代码,花费数小时甚至数天的计算时间来渲染最终的地是否可以利用现代云的力量处理数千亿字的全球新闻报道,以梳理语言的基础地理语境化并提供近乎交互式的映射速度?为了进一步探索这一点,我最近尝试从我的开源GDELT项目中绘制一整年的数据,以可视化与每个单词最密切相关的位置。从2017年4月6日到2018年5月4日,GDELT在65种语言的260,022,952篇新闻文章中共监控了126,101,464,912个全球新闻报道,总计超过1TB的文本。其全文地理编码算法已经在这25亿条新闻文章中确定了共有1,528,264,141个提及741,899个不同地点的地点,每82个字左右就有一个位置提到。对于这15亿个位置提及中的每一个,系统在每个位置参考之前和之后出现在300个字符内的每篇文章的英语机器翻译中构建了最常见单词的直方图。与之前需要花费数小时才能运行的分析和巨大的专用代码库相比,最后的分析仅使用一行SQL完成,仅需307.3秒。这可以达到大约3.3GB / s的原始处理速度,包括将数千亿条记录汇总到最终分析中。最终结果是一个庞大的数据库,列出了过去一年中最常出现的前200,000个最常用单词中最常出现的前1500个地点。换句话说,任何一个词,例如“putin”或“love”,你会得到一张地图,这张地图最常见于上一篇文章中,在过去一年的全球新闻文章中超过25亿。下面的地图显示了“putin”这个词的最终结果。简而言之,这些是过去一年中“putin”这个词最常见的位置。总的来说,这张地图非常有意义,欧洲,特别是东欧,在提及t时占据突出地位

新闻类别

热门作者

Author unknown 岸本齐史 知乎 东野圭吾 约翰·迪克森·卡尔 哈佛商业评论 埃里克•拉森 陈雷 约瑟夫•J.埃利斯(Joseph J. Ellis) 凤凰周刊 伊恩•布鲁玛 陈磊·半小时漫画团队 墨小七 亨利·戴维·梭罗 财经杂志 杂志 社 J.R.R.托尔金 尤金·罗根 Landis Blair Cixin Liu 巴巴拉·W·塔奇曼 许倬云 渡边淳一 王欣(@反裤衩阵地) 卢卡·莫扎蒂 李飚 加藤阳子 樊锦诗 赵南柱 八路 六层楼 [日]今村昌弘 著 吕灵芝 译 Anjali Khatri 弗兰克•赫伯特 尼尔·德格拉斯·泰森 鸟山明 卡洛·罗韦利 村上春树 (Haruki Murakami) 尼恩 霍格尔·丹贝克 魏梦舒 Keiron Pim 李洱 C.J.图德 读者 季羡林 Aron Rubin Robert Aiello 弗朗西斯科·西里洛 王一凡 玛丽·比尔德 水湄物语 理查德·A.纳克 埃丝特·K·乔伊 房龙 周国平 布鲁克·诺埃尔·穆尔 李尚龙 刘兆佳 张玮 Jane Austen 西蒙·佩雷斯(Shimon Peres) 陈志华 豪尔赫•路易斯•博尔赫斯 沃尔特·沙伊德尔 克里斯蒂娜·费雷弗勒里 屈原 杨森 刘火良 埃·韦·布拉金斯基 少数派编辑部 艾莉森·高普尼克(Alison Gopnik) 星球研究所 张宏杰 赛珍珠 Chris Crowley 冯唐 比尔·布莱森 史景迁 罗杰·克劳利(Roger Crowley) 杉山正明 萨拉·罗斯 志驾晃 莎士比亚 尚小明 埃德·扬 Nikhil Pathania 高满堂 弗雷德里克·皮耶鲁齐 朱迪亚·珀尔 西蒙·温彻斯特 李淼 迈克尔·夏邦 布鲁斯·罗森布罗姆 喜仁龙 奥森·斯科特·卡德 刘刚 徐艳芳 汉语大字典编纂处 白先勇 吉姆·阿尔-哈里里