WEKO3
インデックスリンク
アイテム
カーネル・データスカッシング:カーネル密度推定法のデータマイニングへの応用
https://doi.org/10.24517/00000450
https://doi.org/10.24517/00000450e3b372a1-a13e-48b4-9ca2-330f7c665636
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Item type | 学術雑誌論文 / Journal Article(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2017-10-02 | |||||||||
タイトル | ||||||||||
タイトル | カーネル・データスカッシング:カーネル密度推定法のデータマイニングへの応用 | |||||||||
言語 | ||||||||||
言語 | jpn | |||||||||
資源タイプ | ||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||||
資源タイプ | journal article | |||||||||
ID登録 | ||||||||||
ID登録 | 10.24517/00000450 | |||||||||
ID登録タイプ | JaLC | |||||||||
その他のタイトル | ||||||||||
<特集>ノンパラメトリック法の新展開 | ||||||||||
その他のタイトル | ||||||||||
Kernel Data Squashing : An Application of Kernel Density Estimation Techniques to Mining Massive Data Sets(<Special Section>New Developments in Nonparametric Method) | ||||||||||
著者 |
小暮, 厚之
× 小暮, 厚之× 寒河江, 雅彦 |
|||||||||
著者別表示 |
Kogure, Atsuyuki
× Kogure, Atsuyuki
× Sagae, Masahiko
|
|||||||||
書誌情報 |
日本統計学会誌. シリーズJ = Journal of the Japan Statistical Society. Japanese issue 巻 39, 号 2, p. 243-263, 発行日 2010-03-01 |
|||||||||
ISSN | ||||||||||
収録物識別子タイプ | ISSN | |||||||||
収録物識別子 | 0389-5602 | |||||||||
NCID | ||||||||||
収録物識別子タイプ | NCID | |||||||||
収録物識別子 | AA11989749 | |||||||||
出版者 | ||||||||||
出版者 | 日本統計学会 = Japan Statistical Society | |||||||||
抄録 | ||||||||||
内容記述タイプ | Abstract | |||||||||
内容記述 | DuMouchel et al.(1999)は,大量データの統計分析の計算負荷を緩和するために,データスカッシング(data squashing)というマイニング手法を提案した.この手法の考え方は,大量データを分析するための計算アルゴリズムを「拡大させる」のではなく,大量データセットを代表的なサンプル(squashed data)へと「縮小させる」というものである.しかし,大量データの統計的情報を保持するようにスカッシングを行うためには,大規模な(非線形)連立方程式を解くことが必要となり,データスカッシングの既存の手法は依然として計算負荷が大きい.この困難を解決するために,本稿ではスカッシング実装への新たなアプローチとしてカーネル・データスカッシング(KDS)を提案する.KDSは,その名前が示唆するようにカーネル密度推定法を利用したものである.KDSは連立方程式を解くステップを必要とせず,簡単に実装可能である.KDSが大量データの統計的情報を十分に保存することを示すために,KDSに基づく最尤法の漸近的なバイアスと漸近分散を導出する.さらに,我々の結果を例示するためのいくつかのシミュレーションを行う. The data squashing is proposed by DuMouchel et al. (1999) to deal with massive data sets. The idea is to scale data sets down to smaller representative samples, squashed data, instead of scaling up algorithms to large data sets. However, the original scheme for the construction of the squashed data may still be computationally burdensome because it usually requires solving a large system of equations. To overcome this difficulty we propose a new method, the Kernel Data Squashing (KDS), which does not involve solving such equations and thus is easy to implement. To examine if our approach preserves much of the statistical information of the massive data set, we study the accuracy of the maximum likelihood estimator based on the KDS. In particular, we derive the asymptotic bias and variance of the KDS-based maximum likelihood estimator. The results show that the KDS preserves the statistical information of the original massive data set as required. Some simulation study is provided to explain our results. | |||||||||
権利 | ||||||||||
権利情報 | 日本統計学会 | 本文データは学協会の許諾に基づきCiNiiから複製したものである | |||||||||
著者版フラグ | ||||||||||
出版タイプ | VoR | |||||||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||||||
関連URI | ||||||||||
識別子タイプ | URI | |||||||||
関連識別子 | http://www.jss.gr.jp/index.html | |||||||||
関連URI | ||||||||||
識別子タイプ | URI | |||||||||
関連識別子 | http://ci.nii.ac.jp/naid/110007618316 |