The goal of this repo is to host code for the analysis of OD data from the 2017 household travel survey in Sao Paulo. The data has the following structure.
zona | muni\_dom | co\_dom\_x | co\_dom\_y | id\_dom | f\_dom | fe\_dom | dom | cd\_entre | data | tipo\_dom | agua | rua\_pavi | no\_morad | tot\_fam | id\_fam | f\_fam | fe\_fam | familia | no\_moraf | condmora | qt\_banho | qt\_empre | qt\_auto | qt\_micro | qt\_lavalou | qt\_gel1 | qt\_gel2 | qt\_freez | qt\_mlava | qt\_dvd | qt\_microon | qt\_moto | qt\_secarou | qt\_bicicle | nao\_dcl\_it | criteriobr | ponto\_br | ano\_auto1 | ano\_auto2 | ano\_auto3 | renda\_fa | cd\_renfa | id\_pess | f\_pess | fe\_pess | pessoa | sit\_fam | idade | sexo | estuda | grau\_ins | cd\_ativi | co\_ren\_i | vl\_ren\_i | zona\_esc | muniesc | co\_esc\_x | co\_esc\_y | tipo\_esc | zonatra1 | munitra1 | co\_tr1\_x | co\_tr1\_y | trab1\_re | trabext1 | ocup1 | setor1 | vinc1 | zonatra2 | munitra2 | co\_tr2\_x | co\_tr2\_y | trab2\_re | trabext2 | ocup2 | setor2 | vinc2 | n\_viag | fe\_via | dia\_sem | tot\_viag | zona\_o | muni\_o | co\_o\_x | co\_o\_y | zona\_d | muni\_d | co\_d\_x | co\_d\_y | zona\_t1 | muni\_t1 | co\_t1\_x | co\_t1\_y | zona\_t2 | muni\_t2 | co\_t2\_x | co\_t2\_y | zona\_t3 | muni\_t3 | co\_t3\_x | co\_t3\_y | motivo\_o | motivo\_d | mot\_sres | servir\_o | servir\_d | modo1 | modo2 | modo3 | modo4 | h\_saida | min\_saida | anda\_o | h\_cheg | min\_cheg | anda\_d | duracao | modoprin | tipvg | pag\_viag | tp\_esauto | vl\_est | pe\_bici | via\_bici | tp\_esbici | distancia | id\_ordem |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | 36 | 333743 | 7394463 | 00010001 | 1 | 15.41667 | 1 | 1 | 06092017 | 1 | 1 | 1 | 2 | 1 | 000100011 | 1 | 15.41667 | 1 | 2 | 2 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 1 | 4 | 25 | NA | NA | NA | 2732.576 | 3 | 00010001101 | 1 | 19.53227 | 1 | 1 | 59 | 2 | 1 | 3 | 1 | 3 | NA | NA | NA | NA | NA | NA | 3 | 36 | 333104 | 7394476 | 2 | 2 | 4 | 13 | 1 | NA | NA | NA | NA | NA | NA | NA | NA | NA | 1 | 22.13265 | 3 | 2 | 1 | 36 | 333743 | 7394463 | 3 | 36 | 333104 | 7394476 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | 8 | 3 | 3 | 2 | 2 | 16 | NA | NA | NA | 5 | 45 | NA | 5 | 55 | NA | 10 | 16 | 3 | NA | NA | NA | 1 | NA | NA | 639.1322 | 1 |
1 | 36 | 333743 | 7394463 | 00010001 | 0 | 15.41667 | 1 | 1 | 06092017 | 1 | 1 | 1 | 2 | 1 | 000100011 | 0 | 15.41667 | 1 | 2 | 2 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 1 | 4 | 25 | NA | NA | NA | 2732.576 | 3 | 00010001101 | 0 | 19.53227 | 1 | 1 | 59 | 2 | 1 | 3 | 1 | 3 | NA | NA | NA | NA | NA | NA | 3 | 36 | 333104 | 7394476 | 2 | 2 | 4 | 13 | 1 | NA | NA | NA | NA | NA | NA | NA | NA | NA | 2 | 22.13265 | 3 | 2 | 3 | 36 | 333104 | 7394476 | 1 | 36 | 333743 | 7394463 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | 3 | 8 | 3 | 2 | 2 | 16 | NA | NA | NA | 15 | 45 | NA | 15 | 55 | NA | 10 | 16 | 3 | NA | NA | NA | 1 | NA | NA | 639.1322 | 2 |
1 | 36 | 333743 | 7394463 | 00010001 | 0 | 15.41667 | 1 | 1 | 06092017 | 1 | 1 | 1 | 2 | 1 | 000100011 | 0 | 15.41667 | 1 | 2 | 2 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 1 | 4 | 25 | NA | NA | NA | 2732.576 | 3 | 00010001102 | 1 | 16.66398 | 2 | 3 | 21 | 2 | 5 | 4 | 1 | 3 | NA | 84 | 36 | 329431 | 7395939 | 2 | 82 | 36 | 327503 | 7392159 | 2 | 2 | 4 | 7 | 2 | NA | NA | NA | NA | NA | NA | NA | NA | NA | 1 | 18.88249 | 3 | 3 | 1 | 36 | 333743 | 7394463 | 82 | 36 | 327503 | 7392159 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | 8 | 3 | 3 | 2 | 2 | 1 | NA | NA | NA | 9 | 0 | 10 | 9 | 50 | 20 | 50 | 1 | 1 | 2 | NA | NA | NA | NA | NA | 6651.7679 | 3 |
1 | 36 | 333743 | 7394463 | 00010001 | 0 | 15.41667 | 1 | 1 | 06092017 | 1 | 1 | 1 | 2 | 1 | 000100011 | 0 | 15.41667 | 1 | 2 | 2 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 1 | 4 | 25 | NA | NA | NA | 2732.576 | 3 | 00010001102 | 0 | 16.66398 | 2 | 3 | 21 | 2 | 5 | 4 | 1 | 3 | NA | 84 | 36 | 329431 | 7395939 | 2 | 82 | 36 | 327503 | 7392159 | 2 | 2 | 4 | 7 | 2 | NA | NA | NA | NA | NA | NA | NA | NA | NA | 2 | 18.88249 | 3 | 3 | 82 | 36 | 327503 | 7392159 | 84 | 36 | 329431 | 7395939 | 93 | 36 | 329861 | 7397268 | NA | NA | NA | NA | NA | NA | NA | NA | 3 | 4 | 4 | 2 | 2 | 1 | 4 | NA | NA | 17 | 0 | 20 | 18 | 0 | 1 | 60 | 1 | 1 | 2 | NA | NA | NA | NA | NA | 4243.2987 | 4 |
1 | 36 | 333743 | 7394463 | 00010001 | 0 | 15.41667 | 1 | 1 | 06092017 | 1 | 1 | 1 | 2 | 1 | 000100011 | 0 | 15.41667 | 1 | 2 | 2 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 1 | 4 | 25 | NA | NA | NA | 2732.576 | 3 | 00010001102 | 0 | 16.66398 | 2 | 3 | 21 | 2 | 5 | 4 | 1 | 3 | NA | 84 | 36 | 329431 | 7395939 | 2 | 82 | 36 | 327503 | 7392159 | 2 | 2 | 4 | 7 | 2 | NA | NA | NA | NA | NA | NA | NA | NA | NA | 3 | 18.88249 | 3 | 3 | 84 | 36 | 329431 | 7395939 | 1 | 36 | 333743 | 7394463 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | 4 | 8 | 4 | 2 | 2 | 12 | NA | NA | NA | 22 | 50 | 1 | 23 | 30 | 1 | 40 | 12 | 2 | NA | NA | NA | NA | NA | NA | 4557.6222 | 5 |
1 | 36 | 333814 | 7394428 | 00010002 | 1 | 15.41667 | 2 | 1 | 06092017 | 1 | 1 | 1 | 4 | 1 | 000100021 | 1 | 15.41667 | 1 | 4 | 1 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 1 | 5 | 18 | NA | NA | NA | 3200.000 | 1 | 00010002101 | 1 | 19.53227 | 1 | 1 | 37 | 2 | 1 | 4 | 1 | 1 | 1000 | NA | NA | NA | NA | NA | 1 | 36 | 333453 | 7394501 | 2 | 2 | 6 | 4 | 1 | NA | NA | NA | NA | NA | NA | NA | NA | NA | 1 | 22.13265 | 3 | 4 | 1 | 36 | 333814 | 7394428 | 1 | 36 | 333453 | 7394501 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | 8 | 2 | 2 | 2 | 2 | 16 | NA | NA | NA | 8 | 0 | NA | 8 | 10 | NA | 10 | 16 | 3 | NA | NA | NA | 1 | NA | NA | 368.3069 | 6 |
The dataset contains nearly 200k rows and 128 columns.
#> [1] 183092 128
Column names are as follows:
#> [1] "zona" "muni_dom" "co_dom_x" "co_dom_y" "id_dom"
#> [6] "f_dom" "fe_dom" "dom" "cd_entre" "data"
#> [11] "tipo_dom" "agua" "rua_pavi" "no_morad" "tot_fam"
#> [16] "id_fam" "f_fam" "fe_fam" "familia" "no_moraf"
#> [21] "condmora" "qt_banho" "qt_empre" "qt_auto" "qt_micro"
#> [26] "qt_lavalou" "qt_gel1" "qt_gel2" "qt_freez" "qt_mlava"
#> [31] "qt_dvd" "qt_microon" "qt_moto" "qt_secarou" "qt_bicicle"
#> [36] "nao_dcl_it" "criteriobr" "ponto_br" "ano_auto1" "ano_auto2"
#> [41] "ano_auto3" "renda_fa" "cd_renfa" "id_pess" "f_pess"
#> [46] "fe_pess" "pessoa" "sit_fam" "idade" "sexo"
#> [51] "estuda" "grau_ins" "cd_ativi" "co_ren_i" "vl_ren_i"
#> [56] "zona_esc" "muniesc" "co_esc_x" "co_esc_y" "tipo_esc"
#> [61] "zonatra1" "munitra1" "co_tr1_x" "co_tr1_y" "trab1_re"
#> [66] "trabext1" "ocup1" "setor1" "vinc1" "zonatra2"
#> [71] "munitra2" "co_tr2_x" "co_tr2_y" "trab2_re" "trabext2"
#> [76] "ocup2" "setor2" "vinc2" "n_viag" "fe_via"
#> [81] "dia_sem" "tot_viag" "zona_o" "muni_o" "co_o_x"
#> [86] "co_o_y" "zona_d" "muni_d" "co_d_x" "co_d_y"
#> [91] "zona_t1" "muni_t1" "co_t1_x" "co_t1_y" "zona_t2"
#> [96] "muni_t2" "co_t2_x" "co_t2_y" "zona_t3" "muni_t3"
#> [101] "co_t3_x" "co_t3_y" "motivo_o" "motivo_d" "mot_sres"
#> [106] "servir_o" "servir_d" "modo1" "modo2" "modo3"
#> [111] "modo4" "h_saida" "min_saida" "anda_o" "h_cheg"
#> [116] "min_cheg" "anda_d" "duracao" "modoprin" "tipvg"
#> [121] "pag_viag" "tp_esauto" "vl_est" "pe_bici" "via_bici"
#> [126] "tp_esbici" "distancia" "id_ordem"
Key columns are modo1
:
#>
#> Labels:
#> value label
#> 1 Metrô
#> 2 Trem
#> 3 Monotrilho
#> 4 Ônibus/micro-ônibus/perua do município de São Paulo
#> 5 Ônibus/micro-ônibus/perua de outros municípios
#> 6 Ônibus/micro-ônibus/perua metropolitano
#> 7 Transporte fretado
#> 8 Transporte escolar
#> 9 Dirigindo automóvel
#> 10 Passageiro de automóvel
#> 11 Táxi convencional
#> 12 Táxi não convencional
#> 13 Dirigindo moto
#> 14 Passageiro de moto
#> 15 Bicicleta
#> 16 A pé
#> 17 Outros
We can map a sample of the data as follows:
#> co_o_x co_o_y co_d_x co_d_y
#> Min. :295034 Min. :7370625 Min. :294581 Min. :7375274
#> 1st Qu.:326134 1st Qu.:7390746 1st Qu.:325462 1st Qu.:7389626
#> Median :330651 Median :7395244 Median :330684 Median :7394994
#> Mean :336034 Mean :7394347 Mean :335293 Mean :7394305
#> 3rd Qu.:338522 3rd Qu.:7398495 3rd Qu.:337528 3rd Qu.:7397539
#> Max. :413010 Max. :7420580 Max. :400793 Max. :7416888
#> [1] 19.62695