PNN Class Prediction

开始之前

通常，您使用一个数据集来训练分类器和其他对其进行测试。每个基因表达数据集包含两个文件:

GCT或RES文件包含基因表达数据.
示例文件(培训数据): all_aml_train.gct.
示例文件(测试数据): all_aml_test.gct.
CLS文件标识在基因表达数据的每个样本的类.
示例文件(培训数据): all_aml_train.cls.
示例文件(测试数据): all_aml_test.cls.

了解更多:
文件格式

步骤1: PreprocessDataset

基因表达训练数据进行预处理，以删除平台噪声和基因几乎没有变化。注意：如果预处理数据删除相关的生物信息，请跳过此步骤.

不表达基因测试的数据进行预处理。基因测试数据应包含所有目前在训练数据.

开放模块在GenePattern窗口.
打开模块与培训数据.

注意事项

PreprocessDataset数据进行预处理可以在一个或多个方法(以此顺序):
1. 设置阈值和上限值。更低的/高的任何值超过阈值下限值重置为阈值/最大值.
2. 每个表达式的值转换为日志基值的2.
3. 如果一个给定的数字样品的值小于给定阈值，移除基因(行).
4. 删除基因(行)，它没有最低折变化或表达式的变化.
5. 离散或规范化数据.
在使用比率比较样本之间的基因表达期间，值转换为日志基值的2，使上下调节基因相同的规模。例如，2的比率和。5表示两倍的变化，上下调节expression2.
如果未生成表达数据，请检查是否已经采取了预处理步骤之前运行PreprocessDataset模块.

了解更多:
预处理

步骤 2: PNNXValidationOptimization

PNNXValidationOptimization迭代运行PNN类预测对已知数据集。对于每次迭代，它只有一个样品，建立了利用剩余的样品分类器，然后测试排除对样本的分类器。在测试之后，各种参数设置，PNNXValidationOptimization创建一个分析结果文件(*.xvopt. odf)，它包含参数的推荐值。结果文件是一个.

注意事项

num 特性参数用于指定范围值尝试。该模块会自动选择最佳的参数设置。您不需要将它运行多次.
尝试替代参数的设置，使用概率神经网络模块，而不是PNNXValidationOptimization模块.

了解更多:
PNNXValidationOptimization

步骤 3: PNN

PNN模块建立/测试分类符通过运行PNN类预测方法:

要建立一个分类器，指定训练数据集。该模块创建一个分类器(.模型).
测试以前生成的分类器中，指定分类器(*.模型)和测试数据集。该模块将创建预测结果文件(*.pred.odf)，它评估预测的准确性.
构建和测试分类器，指定培训和测试数据集。该模块创建一个分类器和预测结果文件.

了解更多:
PNN

步骤4：查看结果

要查看预测结果文件(*. pred. odf)，使用PredictionResultsViewer模块。对于每个示例，该查看器列出了实际的类，预测类别，并预测错误率.

分类器(. 模型)是一个二进制(机器可读的)文件。无法查看，但可以作为输入PNN模块.

注意事项

该PredictionResultsViewer提供了一个绝对错误率(不正确的情况下/例)和ROC错误率(正确接受的分数相对分数假阳性)。使用ROC错误率比较结果的数据集.

了解更多:
阅读器

步骤5：确定未知样本的类

使用PNN模块对未知样本进行分类:

使用保存的模型文件名参数指定先前生成的分类器(.模型文件).
测试文件 参数用于指定表达式的数据集，其中包含未知的样品.
测试类文件名 是必需的参数，指定类的每个样本中表达式的数据集。对于未知的样本中，创建一个类文件，将一些类（例如，"未知"）分配给每个样本。

模块使用分类器来预测每个未知样本的类，并创建一个预测结果文件。使用PredictionResultsViewer模块，以查看预测结果(*.pred.odf)文件:

观众列出了每个样品其实际的和预测的类.
忽略实际的类，这是未知的.
忽略错误率，评价该类预测是反对"知道"数据.