狭い起伏制約によるテラヘルツ吸収曲線の前処理と凸包による迅速な実装
Scientific Reports volume 12、記事番号: 17806 (2022) この記事を引用
378 アクセス
メトリクスの詳細
この研究では、畳み込みニューラル ネットワークによる識別に必要な曲線の起伏を確保しながら、吸収範囲を最小限に抑える THz 吸収曲線を前処理する方法が提案されています。 提案手法の核となる考え方は、曲線のうねりを一対の細い平行線で閉じ込め、正規化曲線を2つの固定点で連続的に回転させることで最適な位置を解決するというものである。 凸包の特徴に基づいて高速アルゴリズムがさらに提案され、その手順が詳細に説明されています。 このアルゴリズムには、いくつかの重要な点セットの定義、傾きの計算と比較、および 4 つの可能な回転からの最適な選択の決定が含まれます。 臨界点探索の合理性を幾何学的に図示したものである。 さらに、この方法の適応について説明し、実際の例を示して、曲線の非線形情報を抽出する方法の能力を示します。 この研究は、コンピューターグラフィックスに関する手法も、THz曲線とパターン認識に関する特徴抽出に貢献していることを示唆しています。
テラヘルツ時間領域分光法は、物質の検出と識別に広く使用されています1、2、3、4。 吸収または消衰係数の曲線は材料の成分と非常に関連しているため、パターン認識はさまざまな背景で行われます5、6、7、8、9。 対称な分子構造を持つ純粋な物質 (ポリエチレンなど) には吸収ピークは観察されません。 さらに、成分スペクトルが重なっているため、ピークはあまり観察されません。 したがって、以前のレポートによると、機械学習は、ハーブ、肉、茶、シリアルを含むがこれらに限定されない調査におけるデータマイニングに重要です。 曲線の前処理はモデルのパフォーマンスに利益をもたらし、満足のいくモデルをトレーニングする際の困難を軽減することが示唆されています。 従来の前処理には、Savitzky-Golay 平滑化、周波数領域でのフィルタリング、多変量散乱補正 (MSC) などが含まれます。これらは、識別に必須の特徴を確保しながら、周波数サンプリングごとに値を調整します10、11、12。 これらのアルゴリズムは数学的にノイズの形式を想定しており、すべてのポイントが均等に処理されます。 ただし、曲線を識別する機能が弱まる可能性があり、一部のパラメーターは良好な結果が得られるように経験的に設定されています。 さらに、コンピュータ グラフィックスを使用する方法は、その後の識別方法を橋渡しするために研究されることはほとんどありません。
畳み込みニューラル ネットワーク (CNN) は、効果的で一般的なモデルとして画像内のオブジェクトを識別するために使用されてきました 13、14、15、16。 CNN がテラヘルツ曲線に関連付けられている場合、モデルのトレーニング前にテラヘルツ曲線から画像への変換 (またはマッピング) が必要です。 スペクトル曲線は、画像内で上部と下部を分離するための意味のある境界として表示されますが、実際の値がそれらにぶつからないため、意味がありません。 その結果、画像内のすべてのピクセルが CNN モデルのトレーニングに参加します。 特定の周波数帯域の吸収範囲を圧縮すれば、コンピューティング コストの削減が期待できますが、識別に必要な機能を確保しておくことが困難です。 図1aに示すように、概略的なTHz曲線は、offset1とoffset2の差に等しい範囲を持っています。 線 2 と線 1 は周波数軸と平行な線で、吸収の上限と下限を示します。 別の 2 本の平行線を使用して曲線を制限すると、それらの間の起伏 (Y オフセットの差) が変化します (図 1b と図 1c に示すように)。 そこで、曲線を最小限の距離で閉じ込める最適な平行線を求め、シアー変換を実行して、Y 方向の冗長性 (吸収次元) を最小限に抑えながら進行した曲線を収容する画像を生成します。 この基本的な考え方に基づいて、提案された方法はナローアンジュレーションコンストレイント(NUC)と名付けられました。