限られたサンプルの工業データ向けの新しい特徴選択手法を開発(Researchers Develop New Feature Selection Method for Limited-sample Industrial Data)

ad

2025-03-04 中国科学院(CAS)

限られたサンプルの工業データ向けの新しい特徴選択手法を開発(Researchers Develop New Feature Selection Method for Limited-sample Industrial Data)Fig. Framework of the proposed robust feature selection method (Image by NIMTE)

中国科学院・寧波材料技術と工学研究所の研究チームは、限られたサンプル数の産業データに適した新しい特徴選択法を開発した。この手法は、相互情報量からノイズエントロピーを除去し、モデルの性能を向上させる。従来の方法では、計算コストの増大や過学習、センサーノイズによる分類性能の低下が課題だった。研究チームは、特徴ノイズを検閲正規分布としてモデル化し、最大エントロピーの原理を用いてノイズエントロピーを算出。これにより、ノイズフリーな相互情報量指標を開発し、ノイズの影響を抑えた特徴選択を実現した。また、「最大ノイズフリー関連性と最小冗長性(MNFR-MR)」基準を導入し、産業用IoTやデジタルツインなどのデータ駆動型技術の精度向上に貢献する。

<関連情報>

限られたサンプルの工業データに対する相互情報内のノイズエントロピーの除去による頑健な特徴選択 Robust Feature Selection by Removing Noise Entropy Within Mutual Information for Limited-Sample Industrial Data

Chan Xu; Silu Chen; Xiangjie Kong; Chi Zhang; Guilin Yang; Zaojun Fang
IEEE Transactions on Industrial Informatics  Published:14 February 2025
DOI:https://doi.org/10.1109/TII.2025.3534417

Abstract

Feature selection is challenging in high-dimensional and small-sample data, particularly in industrial informatics with diverse noise sources. The information entropy of feature noise is included in mutual information of a label and noise-corrupted features, which can be removed to increase classification accuracy. In this article, we propose a robust feature selection method by eliminating feature noise in the relevance measure. Feature noise is modeled as a zero-mean censored normal distribution, so its entropy is determined by solving the variance equation based on the maximum entropy principle. Then, a noisy channel for feature transmission is proposed to extract class-relevant noise component. Furthermore, a noise-free mutual information metric is developed by removing noise entropy within mutual information. Eventually, a novel criterion is proposed by maximizing relevance based on noise-free mutual information while minimizing redundancy. Experimental results confirm the effectiveness of our approach on datasets from various industrial sectors.

1600情報工学一般
ad
ad
Follow
ad
タイトルとURLをコピーしました