Hive空間演算 -5-


引き続き県の集計がうまくいってない原因を調べる。

取り敢えずWKTでローカルにデータを引っこ抜く

INSERT OVERWRITE LOCAL DIRECTORY '/tmp/jpnken' 
SELECT
 jpn.KEN,
 ST_AsText(jpn.shape)
FROM
 kenjpn jpn;

Hive抜けて、データをWindows側に持ってくる。

dir /tmp/

mount -t cifs //ipあどれす/shared /mnt -o username=ゆーざ,password=ぱす
cp -r /tmp/jpnken /mnt/jpnken
umount /mnt

図形が全て先頭の三重県になっている模様
hivewkt

どうもGroup Byと集計関数が期待通りの動作をしないよう。
Partionとかしないと駄目なのかも?

一先ず、ローカルデータ引っこ抜いてSQL Serverに戻すとか出来そうなので満足して、深追いはしないことに。

カテゴリー: 開発, 設計 タグ: , パーマリンク