Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

cnarea20181031数据改动说明 #33

Open
kakuilan opened this issue Apr 19, 2019 · 3 comments
Open

cnarea20181031数据改动说明 #33

kakuilan opened this issue Apr 19, 2019 · 3 comments

Comments

@kakuilan
Copy link
Owner

cnarea20181031数据改动说明

  1. 数据表结构更改
    之前几个版本的数据更新后,经常有基友反馈,因为国内某些区域的新增或裁撤,可能造成同一个地址的id变化,导致出现与cnarea相关表的历史数据不匹配的情况。
    观察了近几年国内的官方数据,大陆地区的area_code(统计用区划代码)很少有改动,除非该地址在行政上做出了调整。因此决定将area_code作为唯一键使用,id只是一个辅助的排序字段。对应的,将parent_id改为parent_code,作为上下级查询字段。
  2. 港澳台area_code编码规则
    国家统计局目前尚未公布港澳台地区的数据,而且距离官方为它们进行统一编码应该还有一段时间。因此只能暂由个人对这些数据进行唯一编码。
    编码规则为:使用murmurhash3对完整地址(如台湾省云林县元长乡庄内路)进行编码,取一个11位整数值,再加上港澳台前缀码。
    前缀码:香港为70,澳门为71,台湾为72。
  3. 2018台湾数据比2017多7千多
    因为数据源中存在将大量同一道路但不同门牌号的地址,作为不同的单独地址,而且它们的邮编也可能不相同。例如,“福来路(双130巷以上)”、“福来路(单131号以上)”、“中山路(双160号以上)”、“中山路(单183号以上)”等。本次数据更新也遵循数据源的做法(因为没时间人工一个个去对这些地址做甄别和去重)。所以,比2017多了7千记录。
  4. 大陆地区村/社区数据变化
    • 2013年 694666
    • 2014年 670479
    • 2015年 667519
    • 2016年 666655
    • 2017年 672584
    • 2018年 665040
      估计2017年的数据有误差。整体上看,很多村庄在消失。感慨一下。

以上信息,请各位了解。

@houseme
Copy link

houseme commented Oct 9, 2019

村消失了是因为好多村级组织合并导致的吧!

@shizhimin123
Copy link

我想问下 数据里面的经纬度的坐标系是高德还是84的呀

@kakuilan
Copy link
Owner Author

@shizhimin123
省市县是高德的,区县以下是腾讯的.
#38

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants