# 統計LOD NOTEBOOK

手探りでSPARQLを書きながら、統計LODの利用イメージを想像できたらと考えています。

## プロパティパスを使ったSPQRQL、使わないSPARQL

SPARQL初心者の自分は、プロパティパスを使った場合エリアコードをキーに興味のある様々な値を複数のプロパティを使ってどのように取得すべきかわからないので、冗長ではあるけどエリアコードの変数を明示してプロパティパスを使わずサンプルを書いています。

In [23]:
%endpoint http://data.e-stat.go.jp/lod/sparql/query
%display raw
# 新宿区の日本人の人口を求める（プロパティパス）
PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#> 
PREFIX cd-dimension:<http://data.e-stat.go.jp/lod/ontology/crossDomain/dimension/> 
PREFIX cd-code:<http://data.e-stat.go.jp/lod/ontology/crossDomain/code/> 
PREFIX cd-attribute:<http://data.e-stat.go.jp/lod/ontology/crossDomain/attribute/> 
PREFIX cd-dimension-2016:<http://data.e-stat.go.jp/lod/ontology/crossDomain/dimension/2016/> 
PREFIX cd-code-2016:<http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/> 
PREFIX pc-measure-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/measure/2010/> 
PREFIX pc-dimension-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/dimension/2010/> 
PREFIX pc-code-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/code/2010/> 
PREFIX sac:<http://data.e-stat.go.jp/lod/sac/> 
PREFIX ic:<http://imi.ipa.go.jp/ns/core/rdf#> 
select  ?o 
where {
      ?s pc-measure-2010:population ?o ;
         cd-dimension:standardAreaCode / ic:市区町村 "新宿区"@ja ;
         cd-dimension-2016:sex cd-code-2016:sex-total ; 
         cd-dimension-2016:nationality cd-code-2016:nationality-japanese ; 
         pc-dimension-2010:area pc-code-2010:area-all ; 
         cd-dimension-2016:age cd-code-2016:age-total . 
}

{'head': {'vars': ['o']},
 'results': {'bindings': [{'o': {'datatype': 'http://www.w3.org/2001/XMLSchema#decimal',
                                 'type': 'typed-literal',
                                 'value': '286398'}}]}}

In [1]:
%endpoint http://data.e-stat.go.jp/lod/sparql/query
%display raw
# プロパティパスを使わないで書いてみる
PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#> 
PREFIX cd-dimension:<http://data.e-stat.go.jp/lod/ontology/crossDomain/dimension/> 
PREFIX cd-code:<http://data.e-stat.go.jp/lod/ontology/crossDomain/code/> 
PREFIX cd-attribute:<http://data.e-stat.go.jp/lod/ontology/crossDomain/attribute/> 
PREFIX cd-dimension-2016:<http://data.e-stat.go.jp/lod/ontology/crossDomain/dimension/2016/> 
PREFIX cd-code-2016:<http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/> 
PREFIX pc-measure-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/measure/2010/> 
PREFIX pc-dimension-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/dimension/2010/> 
PREFIX pc-code-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/code/2010/> 
PREFIX sac:<http://data.e-stat.go.jp/lod/sac/> 
PREFIX ic:<http://imi.ipa.go.jp/ns/core/rdf#> 
select  ?o 
where {
      ?s pc-measure-2010:population ?o ;
         cd-dimension:standardAreaCode ?areacode.
      ?areacode  ic:市区町村  "新宿区"@ja.
      ?s cd-dimension-2016:nationality cd-code-2016:nationality-japanese ; 
         cd-dimension-2016:sex cd-code-2016:sex-total ; 
         pc-dimension-2010:area pc-code-2010:area-all ; 
         cd-dimension-2016:age cd-code-2016:age-total . 
}

{'head': {'vars': ['o']},
 'results': {'bindings': [{'o': {'datatype': 'http://www.w3.org/2001/XMLSchema#decimal',
                                 'type': 'typed-literal',
                                 'value': '286398'}}]}}

# 統計LODサポートを使って興味のあるプロパティを検索し、統計LODのデータを取得する

## 保育園数や保育園入所待機児童数を取得してみます。
- [統計LODサポート](http://idease.info/lodstat/)に「保育」と入力して検索。
- 「保育所数」「保育所在所児数」「保育所入所待機児童数」などのプロパティが表示されます。この中からまず、保育所入所待機児童数を取得することにします。
- 統計LODサポートで検索された「保育所入所待機児童数」をクリックします。
- 保育所数のプロパティ（predicate）「http://data.e-stat.go.jp/lod/ontology/systemOfSocialAndDemographicStatistics/measure/2016/J250502」 が長いのでPREFIXを"ssds-measure-2016"のように設定します。
- 待機児童数（この場合RDFの目的語になる）を指す変数を「?taikijido」とします
- セルID　 保育所数の述語　　待機児童数; のRDFを記述
- セルID（省略形式）　エリアコード（PREFIXを利用）を指す述語 エリアコード（未知の変数）. を記述
- [共通語彙基盤](http://imi.go.jp/ns/core/Core232.html)のコア語彙「市区町村」を使って、エリアコード  市区町村 新宿区. を記述し、新宿区のエリアコードを取得します。
- SPARQLを実行すると新宿区の待機児童数が変数taikijidoとして取得されます。


In [3]:
%endpoint http://data.e-stat.go.jp/lod/sparql/query
#新宿区の待機児童数
PREFIX ssds-measure-2016:<http://data.e-stat.go.jp/lod/ontology/systemOfSocialAndDemographicStatistics/measure/2016/>
PREFIX cd-dimension:<http://data.e-stat.go.jp/lod/ontology/crossDomain/dimension/> 
PREFIX ic:<http://imi.ipa.go.jp/ns/core/rdf#> 
select ?taikijido
where{
    ?s ssds-measure-2016:J250502 ?taikijido;
        cd-dimension:standardAreaCode ?areacode.
     ?areacode ic:市区町村  "新宿区"@ja.
}

{'head': {'vars': ['taikijido']},
 'results': {'bindings': [{'taikijido': {'datatype': 'http://www.w3.org/2001/XMLSchema#decimal',
                                         'type': 'typed-literal',
                                         'value': '176'}}]}}

## UNIONを使って「新宿区」と「文京区」のOR条件で取得する

In [3]:
%endpoint http://data.e-stat.go.jp/lod/sparql/query
%display raw
PREFIX ssds-measure-2016:<http://data.e-stat.go.jp/lod/ontology/systemOfSocialAndDemographicStatistics/measure/2016/>
PREFIX cd-dimension:<http://data.e-stat.go.jp/lod/ontology/crossDomain/dimension/> 
PREFIX ic:<http://imi.ipa.go.jp/ns/core/rdf#> 
select ?保育所数
where{
        {
        ?s ssds-measure-2016:J2503 ?保育所数;
        cd-dimension:standardAreaCode / ic:市区町村 "新宿区"@ja. 
            } union {
        ?s ssds-measure-2016:J2503 ?保育所数;
        cd-dimension:standardAreaCode / ic:市区町村 "文京区"@ja. 
        }
}

{'head': {'vars': ['保育所数']},
 'results': {'bindings': [{'保育所数': {'datatype': 'http://www.w3.org/2001/XMLSchema#decimal',
                                    'type': 'typed-literal',
                                    'value': '36'}},
                          {'保育所数': {'datatype': 'http://www.w3.org/2001/XMLSchema#decimal',
                                    'type': 'typed-literal',
                                    'value': '28'}}]}}

## 都道府県名のプロパティで東京都のエリアコードを取得し、東京都の待機児童数を取得

In [2]:
%endpoint http://data.e-stat.go.jp/lod/sparql/query
%display table
PREFIX ssds-measure-2016:<http://data.e-stat.go.jp/lod/ontology/systemOfSocialAndDemographicStatistics/measure/2016/>
PREFIX cd-dimension:<http://data.e-stat.go.jp/lod/ontology/crossDomain/dimension/> 
PREFIX ic:<http://imi.ipa.go.jp/ns/core/rdf#> 
select ?待機児童数 ?市区町村
where{
    ?s ssds-measure-2016:J250502 ?待機児童数;
        cd-dimension:standardAreaCode ?areacode.
     ?areacode ic:都道府県  "東京都"@ja;
         ic:市区町村 ?市区町村.
}
ORDER BY DESC(?待機児童数)
LIMIT 10

待機児童数,市区町村
5279,特別区部
884,世田谷区
578,練馬区
438,大田区
417,板橋区
416,江東区
294,足立区
285,杉並区
270,豊島区
257,町田市


## 区ごとの「保育所在所児童数」「保育所数」を組み合わせてみます。
プロパティパスで逆パス等を使うとまとめて記述できそうだけど、、、、自分は書けないのでとりあえずシンプルに書いてみます。

In [5]:
%endpoint http://data.e-stat.go.jp/lod/sparql/query
%display table
PREFIX ssds-measure-2016:<http://data.e-stat.go.jp/lod/ontology/systemOfSocialAndDemographicStatistics/measure/2016/>
PREFIX cd-dimension:<http://data.e-stat.go.jp/lod/ontology/crossDomain/dimension/> 
PREFIX ic:<http://imi.ipa.go.jp/ns/core/rdf#> 
select ?市区町村 ?保育所数  ?在所児童 ?待機児童
where{
    ?s1 ssds-measure-2016:J250502 ?待機児童;
        cd-dimension:standardAreaCode ?areacode.
     ?areacode ic:都道府県  "東京都"@ja;
         ic:市区町村 ?市区町村.
    ?s2 ssds-measure-2016:J2503 ?保育所数;
        cd-dimension:standardAreaCode ?areacode.
    ?s3 ssds-measure-2016:J2506 ?在所児童;
        cd-dimension:standardAreaCode ?areacode.
}
ORDER BY DESC(?待機児童)
LIMIT 10

市区町村,保育所数,在所児童,待機児童
特別区部,1158,115921,5279
世田谷区,82,8912,884
練馬区,89,8814,578
大田区,84,8756,438
板橋区,93,8477,417
江東区,72,7002,416
足立区,88,8847,294
杉並区,55,5390,285
豊島区,31,3041,270
町田市,56,5257,257


さらに関係ありそうなデータをエリアコードをキーに追加していきたいと思います。
統計LODサポートで今度は「病院」を検索します。「一般病院数」のプロパティがあるのでこれをSPARQLに追加します。
また最初のサンプルで取得しているような、区毎の人口もざっくり（全年齢、全盛別の値で）追加してみます。

In [6]:
%endpoint http://data.e-stat.go.jp/lod/sparql/query
%display table
PREFIX ssds-measure-2016:<http://data.e-stat.go.jp/lod/ontology/systemOfSocialAndDemographicStatistics/measure/2016/>
PREFIX cd-dimension:<http://data.e-stat.go.jp/lod/ontology/crossDomain/dimension/> 
PREFIX pc-measure-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/measure/2010/> 
PREFIX pc-dimension-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/dimension/2010/> 
PREFIX cd-dimension-2016:<http://data.e-stat.go.jp/lod/ontology/crossDomain/dimension/2016/> 
PREFIX pc-code-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/code/2010/> 
PREFIX cd-code-2016:<http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/> 
PREFIX ic:<http://imi.ipa.go.jp/ns/core/rdf#> 
select ?siku ?hoikusyo  ?zaisyo ?taiki ?hospital ?jinko
where{
    ?s1 ssds-measure-2016:J250502 ?taiki;
        cd-dimension:standardAreaCode ?areacode.
     ?areacode ic:都道府県  "東京都"@ja;
         ic:市区町村 ?siku.
    ?s2 ssds-measure-2016:J2503 ?hoikusyo;
        cd-dimension:standardAreaCode ?areacode.
    ?s3 ssds-measure-2016:J2506 ?zaisyo;
        cd-dimension:standardAreaCode ?areacode.
    ?s4 ssds-measure-2016:I510120 ?hospital;
        cd-dimension:standardAreaCode ?areacode.
?s5 pc-measure-2010:population ?jinko;
        cd-dimension:standardAreaCode ?areacode;
        cd-dimension-2016:sex cd-code-2016:sex-total; 
         cd-dimension-2016:nationality cd-code-2016:nationality-japanese; 
         pc-dimension-2010:area pc-code-2010:area-all; 
         cd-dimension-2016:age cd-code-2016:age-total .
}
ORDER BY DESC(?taiki)
LIMIT 10

siku,hoikusyo,zaisyo,taiki,hospital,jinko
特別区部,1158,115921,5279,407,8500358
世田谷区,82,8912,884,25,860559
練馬区,89,8814,578,17,694121
大田区,84,8756,438,27,666330
板橋区,93,8477,417,41,495700
江東区,72,7002,416,17,444062
足立区,88,8847,294,47,656755
杉並区,55,5390,285,17,506982
豊島区,31,3041,270,15,261282
町田市,56,5257,257,14,419062


保育所待機児童数でソートして表示してみました。市区町村の特別区部とは一般的には23区を指すようですが、市区町村とは別にデータが有るのがちょっと気になります。

現状（2016-12-30）だと、エンドポイントのレスポンスがこのぐらいのクエリになるとかなり時間がかかります。

### 集計したセルを含めてみる
本来データを取得してから、別のプロセスで集計を行うべきだと思うのですが、SPARQLで簡単な四則演算を反映した値を取得することもできます。試しに市区町村の人口に対する保育所数の比率を変数として取得してみます。

In [8]:
%endpoint http://data.e-stat.go.jp/lod/sparql/query
%display table
PREFIX ssds-measure-2016:<http://data.e-stat.go.jp/lod/ontology/systemOfSocialAndDemographicStatistics/measure/2016/>
PREFIX cd-dimension:<http://data.e-stat.go.jp/lod/ontology/crossDomain/dimension/> 
PREFIX pc-measure-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/measure/2010/> 
PREFIX pc-dimension-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/dimension/2010/> 
PREFIX cd-dimension-2016:<http://data.e-stat.go.jp/lod/ontology/crossDomain/dimension/2016/> 
PREFIX pc-code-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/code/2010/> 
PREFIX cd-code-2016:<http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/> 
PREFIX ic:<http://imi.ipa.go.jp/ns/core/rdf#> 
PREFIX xsd: <http://www.w3.org/2001/XMLSchema#> 
select ?siku ?hoikusyo  ?zaisyo ?taiki ?hospital ?jinko ?rate
where{
    ?s1 ssds-measure-2016:J250502 ?taiki;
        cd-dimension:standardAreaCode ?areacode.
     ?areacode ic:都道府県  "東京都"@ja;
         ic:市区町村 ?siku.
    ?s2 ssds-measure-2016:J2503 ?hoikusyo;
        cd-dimension:standardAreaCode ?areacode.
    ?s3 ssds-measure-2016:J2506 ?zaisyo;
        cd-dimension:standardAreaCode ?areacode.
    ?s4 ssds-measure-2016:I510120 ?hospital;
        cd-dimension:standardAreaCode ?areacode.
    ?s5 pc-measure-2010:population ?jinko;
        cd-dimension:standardAreaCode ?areacode;
        cd-dimension-2016:sex cd-code-2016:sex-total; 
         cd-dimension-2016:nationality cd-code-2016:nationality-japanese; 
         pc-dimension-2010:area pc-code-2010:area-all; 
         cd-dimension-2016:age cd-code-2016:age-total .
    BIND (xsd:int(?hoikusyo)/xsd:int(?jinko) as ?rate)
}
ORDER BY DESC(?taiki)
LIMIT 20

siku,hoikusyo,zaisyo,taiki,hospital,jinko,rate
特別区部,1158,115921,5279,407,8500358,0.00013622955644926
世田谷区,82,8912,884,25,860559,9.528690072383e-05
練馬区,89,8814,578,17,694121,0.0001282197196166
大田区,84,8756,438,27,666330,0.00012606366214938
板橋区,93,8477,417,41,495700,0.00018761347589267
江東区,72,7002,416,17,444062,0.00016213952105787
足立区,88,8847,294,47,656755,0.00013399212796248
杉並区,55,5390,285,17,506982,0.00010848511386992
豊島区,31,3041,270,15,261282,0.00011864575439563
町田市,56,5257,257,14,419062,0.00013363177763672


## 地域の人口の増減に関わる要素を取得してみる

[統計LODのスキーマ情報/測度](http://data.e-stat.go.jp/lodw/rdfschema/measure/#measure_numberOfEstablishments)で関係しそうなプロパティをピックアップし、データを取得してみることにします。

[共通語彙基盤](http://imi.go.jp/ns/core/Core232.html)を見るとエリアコードは市区町村にも対応しているようです。
id:市区町村とic:都道府県で文字列情報を取得しつつ、エリアコードをキーに色々データを最終的に結合してみることにします。

In [39]:
%endpoint http://data.e-stat.go.jp/lod/sparql/query
%display table
PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#> 
PREFIX cd-dimension:<http://data.e-stat.go.jp/lod/ontology/crossDomain/dimension/>
PREFIX cd-dimension-2016:<http://data.e-stat.go.jp/lod/ontology/crossDomain/dimension/2016/> 
PREFIX cd-code-2016:<http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/> 
PREFIX pc-measure-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/measure/2010/>
PREFIX pc-dimension-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/dimension/2010/>
PREFIX pc-code-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/code/2010/> 
PREFIX ic:<http://imi.ipa.go.jp/ns/core/rdf#> 
select  ?o ?ken ?siku ?areacode
where {
      ?s pc-measure-2010:population ?o ;
         cd-dimension:standardAreaCode ?areacode.
      ?areacode  ic:都道府県 ?ken;
         ic:市区町村 ?siku.
      ?s cd-dimension-2016:nationality cd-code-2016:nationality-japanese ; 
         cd-dimension-2016:sex cd-code-2016:sex-total ; 
         pc-dimension-2010:area pc-code-2010:area-all ; 
         cd-dimension-2016:age cd-code-2016:age-total . 
}

o,ken,siku,areacode
7519,北海道,池田町,http://data.e-stat.go.jp/lod/sac/C01644-19700401
2960,兵庫県,三日月町,http://data.e-stat.go.jp/lod/sac/C28504-20051001
6366,岩手県,松尾村,http://data.e-stat.go.jp/lod/sac/C03306-20050901
76953,新潟県,北区,http://data.e-stat.go.jp/lod/sac/C15101-20070401
15319,北海道,倶知安町,http://data.e-stat.go.jp/lod/sac/C01400-19700401
1258,鹿児島県,里村,http://data.e-stat.go.jp/lod/sac/C46388-20041012
270897,神奈川県,戸塚区,http://data.e-stat.go.jp/lod/sac/C14110-19861103
24028,愛媛県,南宇和郡,http://data.e-stat.go.jp/lod/sac/C38500-19700401
16247,沖縄県,与那原町,http://data.e-stat.go.jp/lod/sac/C47348-19981221
2732,広島県,甲奴町,http://data.e-stat.go.jp/lod/sac/C34563-20040401


少し数分時間がかかるかもしれません。場合によってはタイムアウトするかも。

同様に男女別など、少し細かく市町村区の人口を取得してみます。男女別、年齢別、、の目的語が色々有りそうなのでSPARQLでどんな次元があるか取得してみます。

In [5]:
%endpoint http://data.e-stat.go.jp/lod/sparql/query
%display table
PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#> 
PREFIX cd-dimension:<http://data.e-stat.go.jp/lod/ontology/crossDomain/dimension/>
PREFIX cd-dimension-2016:<http://data.e-stat.go.jp/lod/ontology/crossDomain/dimension/2016/> 
PREFIX cd-code-2016:<http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/> 
PREFIX pc-measure-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/measure/2010/>
PREFIX pc-dimension-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/dimension/2010/>
PREFIX pc-code-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/code/2010/> 
PREFIX sac:<http://data.e-stat.go.jp/lod/sac/> 
PREFIX ic:<http://imi.ipa.go.jp/ns/core/rdf#> 

select  distinct ?sex ?age
where {
      ?s pc-measure-2010:population ?o ;
         cd-dimension:standardAreaCode / ic:市区町村 "静岡市"@ja ;
         cd-dimension-2016:sex ?sex; 
         cd-dimension-2016:age ?age . 
}

sex,age
http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/sex-male,http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/age-40-44
http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/sex-male,http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/age-95-99
http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/sex-male,http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/age-20-24
http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/sex-male,http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/age-92
http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/sex-male,http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/age-25
http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/sex-male,http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/age-68
http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/sex-male,http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/age-5
http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/sex-male,http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/age-9
http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/sex-male,http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/age-30
http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/sex-male,http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/age-71


cd-dimension-2016:ageの次元が思ったよりも細かい！
とりあえず、ある市町村区の男女別の人口を取得するSPARQLを書くと、、男女一度に取得しようとするとタイムアウト？するようなので別々に取得してみます。女性の市区町村レベルの人口を取得するには……

In [20]:
%endpoint http://data.e-stat.go.jp/lod/sparql/query
%display table
PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#> 
PREFIX cd-dimension:<http://data.e-stat.go.jp/lod/ontology/crossDomain/dimension/>
PREFIX cd-dimension-2016:<http://data.e-stat.go.jp/lod/ontology/crossDomain/dimension/2016/> 
PREFIX cd-code-2016:<http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/> 
PREFIX pc-measure-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/measure/2010/>
PREFIX pc-dimension-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/dimension/2010/>
PREFIX pc-code-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/code/2010/> 
PREFIX sac:<http://data.e-stat.go.jp/lod/sac/> 
PREFIX ic:<http://imi.ipa.go.jp/ns/core/rdf#> 
select ?ken ?siku ?areacode ?fjinko
where {
      ?s pc-measure-2010:population ?fjinko ;
         cd-dimension:standardAreaCode ?areacode .
      ?areacode  ic:都道府県 ?ken ;
         ic:市区町村 ?siku .
      ?s cd-dimension-2016:nationality cd-code-2016:nationality-japanese ; 
         cd-dimension-2016:sex cd-code-2016:sex-female ; 
         pc-dimension-2010:area pc-code-2010:area-all ; 
         cd-dimension-2016:age cd-code-2016:age-total .
}

ken,siku,areacode,fjinko
岡山県,長船町,http://data.e-stat.go.jp/lod/sac/C33363-20041101,6487
広島県,久井町,http://data.e-stat.go.jp/lod/sac/C34442-20050322,2504
茨城県,千代田町,http://data.e-stat.go.jp/lod/sac/C08464-20050328,13065
三重県,鈴鹿市,http://data.e-stat.go.jp/lod/sac/C24207-19981001,95413
兵庫県,相生市,http://data.e-stat.go.jp/lod/sac/C28208-19700401,16043
大阪府,福島区,http://data.e-stat.go.jp/lod/sac/C27103-19700401,34807
沖縄県,宜野座村,http://data.e-stat.go.jp/lod/sac/C47313-19921101,2669
長野県,茅野市,http://data.e-stat.go.jp/lod/sac/C20214-20090701,27741
長崎県,上五島町,http://data.e-stat.go.jp/lod/sac/C42407-20040801,3264
和歌山県,川辺町,http://data.e-stat.go.jp/lod/sac/C30384-20050501,3440


次はsex-maleを取得。あとでarecodeをキーにデータをマージするコトにし、その他の情報は省略します。

In [22]:
%endpoint http://data.e-stat.go.jp/lod/sparql/query
%display table
PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#> 
PREFIX cd-dimension:<http://data.e-stat.go.jp/lod/ontology/crossDomain/dimension/>
PREFIX cd-dimension-2016:<http://data.e-stat.go.jp/lod/ontology/crossDomain/dimension/2016/> 
PREFIX cd-code-2016:<http://data.e-stat.go.jp/lod/ontology/crossDomain/code/2016/> 
PREFIX pc-measure-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/measure/2010/>
PREFIX pc-dimension-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/dimension/2010/>
PREFIX pc-code-2010:<http://data.e-stat.go.jp/lod/ontology/populationCensus/code/2010/> 
PREFIX sac:<http://data.e-stat.go.jp/lod/sac/> 
PREFIX ic:<http://imi.ipa.go.jp/ns/core/rdf#> 
select ?areacode ?mjinko
where {
      ?s pc-measure-2010:population ?mjinko ;
         cd-dimension:standardAreaCode ?areacode ;
         cd-dimension-2016:nationality cd-code-2016:nationality-japanese ; 
         cd-dimension-2016:sex cd-code-2016:sex-male ; 
         pc-dimension-2010:area pc-code-2010:area-all ; 
         cd-dimension-2016:age cd-code-2016:age-total .
}

areacode,mjinko
http://data.e-stat.go.jp/lod/sac/C36204-20060320,36407
http://data.e-stat.go.jp/lod/sac/C15562-20050319,4540
http://data.e-stat.go.jp/lod/sac/C17407-20090901,8820
http://data.e-stat.go.jp/lod/sac/C45303-20060101,15530
http://data.e-stat.go.jp/lod/sac/C42202-20160401,120907
http://data.e-stat.go.jp/lod/sac/C27205-20010401,169314
http://data.e-stat.go.jp/lod/sac/C26340-19700401,8823
http://data.e-stat.go.jp/lod/sac/C01212-19700401,11663
http://data.e-stat.go.jp/lod/sac/C17386-20060801,6678
http://data.e-stat.go.jp/lod/sac/C13222-19850208,57184
