2020-12-01から1ヶ月間の記事一覧

細胞種推定のための機械学習入門

若年組織と老化組織の違いとして、「細胞種比率の違い」があります。例えば、老化によって免疫細胞の割合が増減していたりすることがあります。 このような、細胞種の割合を調べるためには、当然ですが全てのデータで細胞種を同定しておく必要があります。デ…

Scanpyの真の力を僕達はまだ知らない

これまで、老化細胞データを読み込むために、ScanpyというPythonパッケージを利用していました。read_h5ad関数でH5ADファイルからデータを読み込んだ後は、他のツールを使って主成分分析(PCA)やt-SNE/UMAPを実行しました。 実は、データ読み込みだけでなく…

主成分分析で次元を落とす

世の中には2種類のデータがあります。Nが大きいデータとpが大きいデータです。 Nはサンプル数、pは特徴量の数を指します。例えばコロナウイルスのデータでは、1つのデータに対して「患者年齢」「患者状態」などの特徴量が10個程度なのに対し、サンプル数は数…

Twitter「荒らし」対策の考察

SNSなどのインターネットサービスにおいて、誹謗中傷のような迷惑行為を行うことを「荒らし」といいます。「荒らし」が被害者に与える影響は小さくなく、場合によっては精神を病んでSNSの利用自体を辞めてしまったり、企業の場合は「荒らし」による炎上で活…