Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Извличане на лицата в държавната йерархия, имущество и бизнес интереси на съпруг/съпруга #39

Open
antitoxic opened this issue Dec 10, 2013 · 0 comments
Labels

Comments

@antitoxic
Copy link
Member

Извличане на инфо от Сметната палата

http://register.bulnao.government.bg/2013/index.html или computer-friendly варианта: http://register.bulnao.government.bg/2013/list.xml

В сайта на сметната палата има списък със декларации на лица, заемащи висши държавни длъжности. Декларациите са полезни за 3 отделни неща:

  1. Можем автоматично да идентифицираме хората в държавната йерархия - кой е президент, кой премиер, заместник, ... тн.
  2. Събираме информация за имоти, депозити, заеми, дялове в дружества и може би да извлечем име на съпруг/съпруга
  3. Можем да извлечем бизнес интереси на съпруг/съпруга - за това ни трябва източник, проверка доколко е сигурно

gif_screencast_5

Ако computer-friendly варианта по някое време спре да работи трябва да обработваме html варианта. Съдържанието на html страницата е зареждано със javascript - тоест нужно е да използваме phantomjs за да можем да извлечем линкове към декларациите

@tsikov tsikov added the scraper label Apr 11, 2014
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

2 participants