Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
  • Product Hunt
  • Visual Capitalist
  • Elon Musk
Menu

Foursquare Open Source Places:地理空间社区的新基础数据集

Posted on 2024-11-20

Foursquare Open Source Places:地理空间社区的新基础数据集

我没想到这个!

[…] 我们今天宣布基础开放数据集 Foursquare Open Source Places(“FSQ OS Places”)全面可用。这个 100 毫米以上全球名胜古迹 (“POI”) 的基础层包括 22 个核心属性(请参阅此处的架构),这些属性将每月更新一次,并可在 Apache 2.0 许可框架下用于商业用途。

数据以托管在 Amazon S3 上的Parquet 文件形式提供。

以下是列出可用文件的方法:

 aws s3 ls s3://fsq-os-places-us-east-1/release/dt=2024-11-19/places/parquet/

我通过places-00000.snappy.parquet取回places-00024.snappy.parquet ,每个文件大约455MB,总共10.6GB数据。

我运行了duckdb ,然后使用 DuckDB 的远程查询 S3 上的 Parquet 的功能来进一步探索数据,而无需先将其下载到我的笔记本电脑上:

 select count(*) from 's3://fsq-os-places-us-east-1/release/dt=2024-11-19/places/parquet/places-00000.snappy.parquet';

返回 4,180,424 – 每个文件的数字相似,表明总共大约有 104,000,000 条记录。

我运行此查询以从第一个文件中以换行符分隔的 JSON 形式检索 1,000 个位置:

 copy ( select * from 's3://fsq-os-places-us-east-1/release/dt=2024-11-19/places/parquet/places-00000.snappy.parquet' limit 1000 ) to '/tmp/places.json';

这是places.json 文件,它被导入到Datasette Lite 中。

最后,我使用 ChatGPT Code Interpreter将该文件转换为 GeoJSON并将结果粘贴到此 Gist 中,从而为我提供了这千个地点的地图(因为 Gists 自动渲染 GeoJSON):

上面有 1000 个标记的世界地图。哥伦比亚的标记显示 Raisbeck, Bogota Dv, Cra 47 A 114 05 Second Floor 的对话框

通过安迪·拜奥

标签:开源、 GIS 、 foursquare 、 datasette-lite 、 parquet 、 duckdb 、代码解释器、人工智能辅助编程、 geojson

原文: https://simonwillison.net/2024/Nov/20/foursquare-open-source-places/#atom-everything

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abdisalan Mohamud
  • Addy Osmani
  • Aeon
  • Ahoy There! on THT's den
  • Alec Muffett
  • Andreas
  • anhvn
  • Ankaph
  • Annie
  • Armin Ronacher
  • Ask Hacker News Weekly
  • Astro Blog
  • Austin White
  • Backlinko
  • Better Dev Link
  • Building Pika Out Loud
  • Caleb Hearth
  • Cédric Aellen
  • Chip Huyen
  • Colossal
  • Cooltools by KK
  • CoRecursive
  • Craig Mod
  • Curt Merrill
  • Dan Abramov's Overreacted Blog RSS Feed
  • Daniel Lemire
  • Daniel Stenberg
  • Daring Fireball
  • David H
  • David Heinemeier Hansson
  • Dayu | 大宇
  • Ed Zitron
  • Ersei
  • Ersei 'n Stuff
  • Evan Martin
  • First Page Sage
  • Founder Weekly
  • FuzzyGrim
  • Gabriel
  • Good Enough
  • Gregory Hammond
  • Habib
  • How They Make Money
  • I Love Charts
  • Ian Betteridge
  • Ivaylo Durmonski
  • Jason Kottke
  • Jason Kratz
  • Jeff Perry
  • John D. Cook
  • Jonas Hietala
  • Jonathan Snook
  • jwb
  • Kevin Kelly
  • Kevin Yank
  • Kirsty
  • Kush
  • Loris Cro
  • Maarten van Gompel
  • Manas J. Saloi
  • Mandy Brown
  • Matt Fantinel
  • Matt Mullenweg
  • Mere Civilian
  • Ness Labs
  • News Letter
  • Nicholas Carlini
  • Nicolas F. R. A. Prado
  • Niko
  • Nir Eyal
  • Noah Smith
  • Pedro Lopes
  • Positive News
  • Predrag Gruevski
  • Rachel Kroll
  • Recomendo by KK
  • rendezvous with cassidoo
  • Rest of World
  • Ruben Schade
  • Scott Galloway
  • Sébastien Etter
  • SEMrush Blog
  • Seth Godin
  • Shariq Raza Qadri
  • Simon Willison
  • Six Colors
  • Slashdot
  • Spectre Collie
  • Spyglass
  • storytelling with data
  • Streamline Blog
  • Tableau Blog
  • tekphloyd
  • The Alchemy of Money
  • The Independent Variable
  • The Marginalian
  • thriftmac
  • Tim Bray
  • Tim Ferriss
  • Tim Kellogg
  • TLDR
  • Topslakr
  • Track Awesome list
  • Trump
  • Victor Kropp
  • Vincent Ritter
  • Vox
  • Westenberg
  • Xe Iaso
  • xkcd
  • Yuri Cunha
  • Zarar
  • 未分类
  • 英文媒体
  • 英文推特
  • 英文独立博客
  • 读写错误
©2026 搞英语 → 看世界 | Design: Newspaperly WordPress Theme