Upload files to "wyniki/redukcja wymiarowosci/eksperyment 2"

This commit is contained in:
Michał Kasprowicz 2025-08-29 07:53:47 +00:00
parent 1f79cb86bb
commit 2018a7fba1
4 changed files with 678 additions and 172 deletions

View File

@ -1,170 +1,38 @@
{
"default": {
"best_params": {
"C": 100,
"gamma": 0.01,
"kernel": "rbf"
"C": 1,
"gamma": "scale",
"kernel": "linear"
},
"best_score": 0.9500000000000001,
"best_score": 0.9866666666666667,
"metrics": {
"accuracy": 0.9418604651162791,
"precision": 0.9430795801020352,
"recall": 0.9418604651162791,
"f1": 0.9417604393109547,
"accuracy": 0.9883720930232558,
"precision": 0.9887596899224806,
"recall": 0.9883720930232558,
"f1": 0.9884978195429303,
"roc_auc": "N/A",
"confusion_matrix": [
[
15,
2,
18,
0,
1,
1,
0
],
[
0,
40,
2,
0,
0,
0
],
[
1,
3,
103,
2,
0,
0
],
[
0,
0,
0,
37,
0,
1
],
[
0,
0,
0,
1,
32,
0
],
[
1,
0,
0,
0,
0,
16
]
]
},
"execution_time": 1.2974693775177002
},
"pca_8": {
"best_params": {
"C": 100,
"gamma": 0.01,
"kernel": "rbf"
},
"best_score": 0.9500000000000001,
"metrics": {
"accuracy": 0.9418604651162791,
"precision": 0.9430795801020352,
"recall": 0.9418604651162791,
"f1": 0.9417604393109547,
"roc_auc": "N/A",
"confusion_matrix": [
[
15,
2,
0,
1,
1,
0
],
[
0,
40,
2,
0,
0,
0
],
[
1,
3,
103,
2,
0,
0
],
[
0,
0,
0,
37,
0,
1
],
[
0,
0,
0,
1,
32,
0
],
[
1,
0,
0,
0,
0,
16
]
]
},
"execution_time": 1.2923190593719482
},
"pca_10": {
"best_params": {
"C": 10,
"gamma": 0.01,
"kernel": "rbf"
},
"best_score": 0.975,
"metrics": {
"accuracy": 0.9767441860465116,
"precision": 0.9769856184584866,
"recall": 0.9767441860465116,
"f1": 0.976722675775346,
"roc_auc": "N/A",
"confusion_matrix": [
[
17,
1,
1,
0,
0,
0
],
[
0,
41,
1,
0,
0,
0,
0
],
[
1,
2,
106,
0,
108,
0,
0,
0
@ -195,7 +63,139 @@
]
]
},
"execution_time": 1.2386040687561035
"execution_time": 1.4771044254302979
},
"pca_8": {
"best_params": {
"C": 100,
"gamma": 0.01,
"kernel": "rbf"
},
"best_score": 0.9383333333333334,
"metrics": {
"accuracy": 0.9302325581395349,
"precision": 0.9294881361228831,
"recall": 0.9302325581395349,
"f1": 0.9295646148717523,
"roc_auc": "N/A",
"confusion_matrix": [
[
14,
4,
0,
1,
0,
0
],
[
0,
37,
5,
0,
0,
0
],
[
2,
1,
104,
2,
0,
0
],
[
1,
0,
1,
36,
0,
0
],
[
0,
0,
0,
0,
33,
0
],
[
0,
0,
0,
0,
1,
16
]
]
},
"execution_time": 1.5615911483764648
},
"pca_10": {
"best_params": {
"C": 1,
"gamma": "scale",
"kernel": "linear"
},
"best_score": 0.9766666666666666,
"metrics": {
"accuracy": 0.9844961240310077,
"precision": 0.9846659800148172,
"recall": 0.9844961240310077,
"f1": 0.9844946760367602,
"roc_auc": "N/A",
"confusion_matrix": [
[
18,
0,
0,
1,
0,
0
],
[
0,
41,
1,
0,
0,
0
],
[
1,
0,
108,
0,
0,
0
],
[
0,
0,
0,
38,
0,
0
],
[
0,
0,
1,
0,
32,
0
],
[
0,
0,
0,
0,
0,
17
]
]
},
"execution_time": 1.321969747543335
},
"pca_12": {
"best_params": {
@ -261,7 +261,7 @@
]
]
},
"execution_time": 1.2703914642333984
"execution_time": 1.3887534141540527
},
"pca_14": {
"best_params": {
@ -327,20 +327,20 @@
]
]
},
"execution_time": 1.3830502033233643
"execution_time": 1.4433538913726807
},
"pca_16": {
"best_params": {
"C": 100,
"gamma": 0.01,
"kernel": "rbf"
"C": 1,
"gamma": "scale",
"kernel": "linear"
},
"best_score": 0.9916666666666667,
"best_score": 0.9866666666666667,
"metrics": {
"accuracy": 0.9767441860465116,
"precision": 0.9780563106144502,
"recall": 0.9767441860465116,
"f1": 0.9770045777038696,
"accuracy": 0.9883720930232558,
"precision": 0.9887596899224806,
"recall": 0.9883720930232558,
"f1": 0.9884978195429303,
"roc_auc": "N/A",
"confusion_matrix": [
[
@ -352,17 +352,17 @@
0
],
[
0,
42,
1,
41,
0,
0,
0,
0
],
[
3,
2,
104,
1,
0,
108,
0,
0,
0
@ -393,6 +393,6 @@
]
]
},
"execution_time": 1.503495216369629
"execution_time": 1.441218614578247
}
}

View File

@ -8,8 +8,8 @@
858,
8
],
"explained_variance": 0.4687167856431779,
"execution_time": 0.011238574981689453,
"explained_variance": 0.46793317923836897,
"execution_time": 0.0389556884765625,
"version_name": "pca_8"
},
{
@ -21,8 +21,8 @@
858,
10
],
"explained_variance": 0.5409859757114897,
"execution_time": 0.011492490768432617,
"explained_variance": 0.5406865166524053,
"execution_time": 0.026678800582885742,
"version_name": "pca_10"
},
{
@ -34,8 +34,8 @@
858,
12
],
"explained_variance": 0.6090170144380542,
"execution_time": 0.016751527786254883,
"explained_variance": 0.6089676509769071,
"execution_time": 0.029541492462158203,
"version_name": "pca_12"
},
{
@ -47,8 +47,8 @@
858,
14
],
"explained_variance": 0.6727583280061241,
"execution_time": 0.016129255294799805,
"explained_variance": 0.6728332461009283,
"execution_time": 0.03361010551452637,
"version_name": "pca_14"
},
{
@ -60,8 +60,8 @@
858,
16
],
"explained_variance": 0.7342437580434953,
"execution_time": 0.032947540283203125,
"explained_variance": 0.734035589094475,
"execution_time": 0.04551839828491211,
"version_name": "pca_16"
}
]

View File

@ -1 +1 @@
{"quantum_results": [["Amplitude_l2", 0.1, 0.7416666666666667], ["Amplitude_l2", 1.0, 0.8516666666666667], ["Amplitude_l2", 10.0, 0.87], ["Amplitude_l1", 0.1, 0.4183333333333334], ["Amplitude_l1", 1.0, 0.45], ["Amplitude_l1", 10.0, 0.835], ["Amplitude_min-max", 0.1, 0.79], ["Amplitude_min-max", 1.0, 0.8816666666666667], ["Amplitude_min-max", 10.0, 0.93]], "quantum_times": {"Amplitude_l2_0.1": {"total_time": 4.137783527374268, "cv_time": 4.137712717056274}, "Amplitude_l2_1.0": {"total_time": 4.097283124923706, "cv_time": 4.097202777862549}, "Amplitude_l2_10.0": {"total_time": 4.088233232498169, "cv_time": 4.088153600692749}, "Amplitude_l1_0.1": {"total_time": 4.094529867172241, "cv_time": 4.094449043273926}, "Amplitude_l1_1.0": {"total_time": 4.0805604457855225, "cv_time": 4.080477714538574}, "Amplitude_l1_10.0": {"total_time": 4.091708183288574, "cv_time": 4.091616153717041}, "Amplitude_min-max_0.1": {"total_time": 4.173805236816406, "cv_time": 4.173725128173828}, "Amplitude_min-max_1.0": {"total_time": 4.246448755264282, "cv_time": 4.246363401412964}, "Amplitude_min-max_10.0": {"total_time": 4.203169584274292, "cv_time": 4.203083753585815}}, "completed_feature_maps": [], "hybrid_scores": {}, "hybrid_eval_times": {}}
{"quantum_results": [["Amplitude_l2", 0.1, 0.7200000000000001], ["Amplitude_l2", 1.0, 0.8966666666666666], ["Amplitude_l2", 10.0, 0.9266666666666667], ["Amplitude_l1", 0.1, 0.4183333333333334], ["Amplitude_l1", 1.0, 0.4183333333333334], ["Amplitude_l1", 10.0, 0.7316666666666668], ["Amplitude_min-max", 0.1, 0.7766666666666667], ["Amplitude_min-max", 1.0, 0.9533333333333333], ["Amplitude_min-max", 10.0, 0.9733333333333333]], "quantum_times": {"Amplitude_l2_0.1": {"total_time": 4.17032527923584, "cv_time": 4.1702656745910645}, "Amplitude_l2_1.0": {"total_time": 4.1761088371276855, "cv_time": 4.176029682159424}, "Amplitude_l2_10.0": {"total_time": 4.178176403045654, "cv_time": 4.178095102310181}, "Amplitude_l1_0.1": {"total_time": 4.1803131103515625, "cv_time": 4.180224418640137}, "Amplitude_l1_1.0": {"total_time": 4.1684653759002686, "cv_time": 4.1683738231658936}, "Amplitude_l1_10.0": {"total_time": 4.224307537078857, "cv_time": 4.224212884902954}, "Amplitude_min-max_0.1": {"total_time": 4.311541795730591, "cv_time": 4.311446905136108}, "Amplitude_min-max_1.0": {"total_time": 4.299652338027954, "cv_time": 4.2995545864105225}, "Amplitude_min-max_10.0": {"total_time": 4.25742244720459, "cv_time": 4.257338523864746}}, "completed_feature_maps": [], "hybrid_scores": {}, "hybrid_eval_times": {}}

View File

@ -0,0 +1,506 @@
======= ROZPOCZĘCIE EKSPERYMENTU DLA PLIKU: dane/TCGA_GBM_LGG_Mutations_clean.csv =======
Wyniki będą zapisane w: wyniki/dim_reduction/29082025-clean/wyniki_svm_TCGA_GBM_LGG_Mutations_clean_20250829_092824.txt
======= INFORMACJE O ŚRODOWISKU =======
Data i czas rozpoczęcia: 2025-08-29 09:28:24
Wersja NumPy: 1.24.3
Wersja Pandas: 2.0.3
Wersja scikit-learn: 1.3.0
Wersja Qiskit: 0.25.1
Wersja qiskit-machine-learning: 0.6.0
Wersja dimod: 0.12.20
Wersja neal: 0.6.0
======= WYBRANE EKSPERYMENTY =======
Klasyczny SVM: TAK
Kwantowy SVM: TAK
Podejście hybrydowe: TAK
======= AKTYWOWANE MAPY CECH =======
ZZ1: NIE
ZZ2: NIE
Pauli1: NIE
Pauli2: NIE
Z1: NIE
Z2: NIE
ZZ1_new: NIE
ZZ2_new: NIE
Amplitude_l2: TAK
Amplitude_l1: TAK
Amplitude_min-max: TAK
======= PRZYGOTOWANIE DANYCH =======
Wymiary oryginalnych danych: (858, 27)
Unikalne wartości zmiennej docelowej: ['Oligodendroglioma, NOS' 'Mixed glioma' 'Astrocytoma, NOS'
'Astrocytoma, anaplastic' 'Oligodendroglioma, anaplastic' 'Glioblastoma']
Rozkład klas: {'Glioblastoma': 360, 'Astrocytoma, anaplastic': 129, 'Mixed glioma': 128, 'Oligodendroglioma, NOS': 108, 'Oligodendroglioma, anaplastic': 75, 'Astrocytoma, NOS': 58}
Wymiary danych po usunięciu kolumn identyfikacyjnych: (858, 24)
Przekształcanie kolumn kategorycznych na binarne...
Kolumny kategoryczne do przekształcenia: ['Gender', 'Primary_Diagnosis', 'Race', 'IDH1', 'TP53', 'ATRX', 'PTEN', 'EGFR', 'CIC', 'MUC16', 'PIK3CA', 'NF1', 'PIK3R1', 'FUBP1', 'RB1', 'NOTCH1', 'BCOR', 'CSMD3', 'SMARCA4', 'GRIN2A', 'IDH2', 'FAT4', 'PDGFRA']
Kolumna Gender zawiera wartości: ['Male' 'Female']
Kolumna Primary_Diagnosis zawiera wartości: ['Oligodendroglioma, NOS' 'Mixed glioma' 'Astrocytoma, NOS'
'Astrocytoma, anaplastic' 'Oligodendroglioma, anaplastic' 'Glioblastoma']
Kolumna Primary_Diagnosis zostanie zakodowana jako one-hot.
Kolumna Race zawiera wartości: ['white' 'asian' 'black or african american' 'not reported'
'american indian or alaska native']
Kolumna Race zostanie zakodowana jako one-hot.
Kolumna IDH1 zawiera wartości: ['MUTATED' 'NOT_MUTATED']
Kolumna TP53 zawiera wartości: ['NOT_MUTATED' 'MUTATED']
Kolumna ATRX zawiera wartości: ['NOT_MUTATED' 'MUTATED']
Kolumna PTEN zawiera wartości: ['NOT_MUTATED' 'MUTATED']
Kolumna EGFR zawiera wartości: ['NOT_MUTATED' 'MUTATED']
Kolumna CIC zawiera wartości: ['NOT_MUTATED' 'MUTATED']
Kolumna MUC16 zawiera wartości: ['NOT_MUTATED' 'MUTATED']
Kolumna PIK3CA zawiera wartości: ['MUTATED' 'NOT_MUTATED']
Kolumna NF1 zawiera wartości: ['NOT_MUTATED' 'MUTATED']
Kolumna PIK3R1 zawiera wartości: ['NOT_MUTATED' 'MUTATED']
Kolumna FUBP1 zawiera wartości: ['MUTATED' 'NOT_MUTATED']
Kolumna RB1 zawiera wartości: ['NOT_MUTATED' 'MUTATED']
Kolumna NOTCH1 zawiera wartości: ['NOT_MUTATED' 'MUTATED']
Kolumna BCOR zawiera wartości: ['NOT_MUTATED' 'MUTATED']
Kolumna CSMD3 zawiera wartości: ['NOT_MUTATED' 'MUTATED']
Kolumna SMARCA4 zawiera wartości: ['NOT_MUTATED' 'MUTATED']
Kolumna GRIN2A zawiera wartości: ['NOT_MUTATED' 'MUTATED']
Kolumna IDH2 zawiera wartości: ['NOT_MUTATED' 'MUTATED']
Kolumna FAT4 zawiera wartości: ['NOT_MUTATED' 'MUTATED']
Kolumna PDGFRA zawiera wartości: ['NOT_MUTATED' 'MUTATED']
Wymiary danych po przekształceniu: (858, 31)
Wypełnianie brakujących wartości...
Wymiary danych wejściowych: (858, 31)
Wymiary danych po skalowaniu: (858, 31)
======= REDUKCJA WYMIAROWOŚCI =======
Testowanie PCA z 8 komponentami...
Wymiary danych po redukcji PCA: (858, 8)
Wyjaśniona wariancja: 0.4679
Czas wykonania PCA: 0.04 sekund
Testowanie PCA z 10 komponentami...
Wymiary danych po redukcji PCA: (858, 10)
Wyjaśniona wariancja: 0.5407
Czas wykonania PCA: 0.03 sekund
Testowanie PCA z 12 komponentami...
Wymiary danych po redukcji PCA: (858, 12)
Wyjaśniona wariancja: 0.6090
Czas wykonania PCA: 0.03 sekund
Testowanie PCA z 14 komponentami...
Wymiary danych po redukcji PCA: (858, 14)
Wyjaśniona wariancja: 0.6728
Czas wykonania PCA: 0.03 sekund
Testowanie PCA z 16 komponentami...
Wymiary danych po redukcji PCA: (858, 16)
Wyjaśniona wariancja: 0.7340
Czas wykonania PCA: 0.05 sekund
Wyniki redukcji wymiarowości zapisane do: wyniki/dim_reduction/29082025-clean/dimension_reduction_results_TCGA_GBM_LGG_Mutations_clean.json
Wybrano najlepszą wersję PCA na podstawie wyjaśnionej wariancji: pca_16 (0.7340)
Wybrano najlepszą wersję redukcji wymiarowości: pca_16
Wymiary domyślnego zbioru treningowego: (600, 16)
Wymiary domyślnego zbioru testowego: (258, 16)
Dostępne wersje zredukowanych danych:
pca_8: Train (600, 8), Test (258, 8)
pca_10: Train (600, 10), Test (258, 10)
pca_12: Train (600, 12), Test (258, 12)
pca_14: Train (600, 14), Test (258, 14)
pca_16: Train (600, 16), Test (258, 16)
Czas przygotowania danych: 0.27 sekund
======= KLASYCZNY SVM (BASELINE) =======
Testowanie klasycznego SVM na wersji danych: default
Wymiary danych: X_train (600, 16), X_test (258, 16)
Rozpoczęcie GridSearchCV dla default...
Najlepsze parametry klasycznego SVM (default): {'C': 1, 'gamma': 'scale', 'kernel': 'linear'}
Dokładność klasycznego SVM (default): 0.9867
Raport klasyfikacji (klasyczny SVM - default):
precision recall f1-score support
Astrocytoma, NOS 0.90 0.95 0.92 19
Astrocytoma, anaplastic 1.00 0.98 0.99 42
Glioblastoma 0.99 0.99 0.99 109
Mixed glioma 1.00 1.00 1.00 38
Oligodendroglioma, NOS 1.00 1.00 1.00 33
Oligodendroglioma, anaplastic 1.00 1.00 1.00 17
accuracy 0.99 258
macro avg 0.98 0.99 0.98 258
weighted avg 0.99 0.99 0.99 258
Szczegółowe metryki dla modelu Klasyczny SVM (default):
Accuracy: 0.9884
Precision: 0.9888
Recall: 0.9884
F1 Score: 0.9885
ROC AUC: N/A
Macierz pomyłek:
[[ 18 0 1 0 0 0]
[ 1 41 0 0 0 0]
[ 1 0 108 0 0 0]
[ 0 0 0 38 0 0]
[ 0 0 0 0 33 0]
[ 0 0 0 0 0 17]]
Czas trenowania i ewaluacji klasycznego SVM (default): 1.48 sekund
Testowanie klasycznego SVM na wersji danych: pca_8
Wymiary danych: X_train (600, 8), X_test (258, 8)
Rozpoczęcie GridSearchCV dla pca_8...
Najlepsze parametry klasycznego SVM (pca_8): {'C': 100, 'gamma': 0.01, 'kernel': 'rbf'}
Dokładność klasycznego SVM (pca_8): 0.9383
Raport klasyfikacji (klasyczny SVM - pca_8):
precision recall f1-score support
Astrocytoma, NOS 0.82 0.74 0.78 19
Astrocytoma, anaplastic 0.88 0.88 0.88 42
Glioblastoma 0.95 0.95 0.95 109
Mixed glioma 0.92 0.95 0.94 38
Oligodendroglioma, NOS 0.97 1.00 0.99 33
Oligodendroglioma, anaplastic 1.00 0.94 0.97 17
accuracy 0.93 258
macro avg 0.92 0.91 0.92 258
weighted avg 0.93 0.93 0.93 258
Szczegółowe metryki dla modelu Klasyczny SVM (pca_8):
Accuracy: 0.9302
Precision: 0.9295
Recall: 0.9302
F1 Score: 0.9296
ROC AUC: N/A
Macierz pomyłek:
[[ 14 4 0 1 0 0]
[ 0 37 5 0 0 0]
[ 2 1 104 2 0 0]
[ 1 0 1 36 0 0]
[ 0 0 0 0 33 0]
[ 0 0 0 0 1 16]]
Czas trenowania i ewaluacji klasycznego SVM (pca_8): 1.56 sekund
Testowanie klasycznego SVM na wersji danych: pca_10
Wymiary danych: X_train (600, 10), X_test (258, 10)
Rozpoczęcie GridSearchCV dla pca_10...
Najlepsze parametry klasycznego SVM (pca_10): {'C': 1, 'gamma': 'scale', 'kernel': 'linear'}
Dokładność klasycznego SVM (pca_10): 0.9767
Raport klasyfikacji (klasyczny SVM - pca_10):
precision recall f1-score support
Astrocytoma, NOS 0.95 0.95 0.95 19
Astrocytoma, anaplastic 1.00 0.98 0.99 42
Glioblastoma 0.98 0.99 0.99 109
Mixed glioma 0.97 1.00 0.99 38
Oligodendroglioma, NOS 1.00 0.97 0.98 33
Oligodendroglioma, anaplastic 1.00 1.00 1.00 17
accuracy 0.98 258
macro avg 0.98 0.98 0.98 258
weighted avg 0.98 0.98 0.98 258
Szczegółowe metryki dla modelu Klasyczny SVM (pca_10):
Accuracy: 0.9845
Precision: 0.9847
Recall: 0.9845
F1 Score: 0.9845
ROC AUC: N/A
Macierz pomyłek:
[[ 18 0 0 1 0 0]
[ 0 41 1 0 0 0]
[ 1 0 108 0 0 0]
[ 0 0 0 38 0 0]
[ 0 0 1 0 32 0]
[ 0 0 0 0 0 17]]
Czas trenowania i ewaluacji klasycznego SVM (pca_10): 1.32 sekund
Testowanie klasycznego SVM na wersji danych: pca_12
Wymiary danych: X_train (600, 12), X_test (258, 12)
Rozpoczęcie GridSearchCV dla pca_12...
Najlepsze parametry klasycznego SVM (pca_12): {'C': 10, 'gamma': 0.01, 'kernel': 'rbf'}
Dokładność klasycznego SVM (pca_12): 0.9817
Raport klasyfikacji (klasyczny SVM - pca_12):
precision recall f1-score support
Astrocytoma, NOS 0.95 0.95 0.95 19
Astrocytoma, anaplastic 0.95 1.00 0.98 42
Glioblastoma 0.98 0.97 0.98 109
Mixed glioma 1.00 0.97 0.99 38
Oligodendroglioma, NOS 1.00 1.00 1.00 33
Oligodendroglioma, anaplastic 1.00 1.00 1.00 17
accuracy 0.98 258
macro avg 0.98 0.98 0.98 258
weighted avg 0.98 0.98 0.98 258
Szczegółowe metryki dla modelu Klasyczny SVM (pca_12):
Accuracy: 0.9806
Precision: 0.9809
Recall: 0.9806
F1 Score: 0.9806
ROC AUC: N/A
Macierz pomyłek:
[[ 18 0 1 0 0 0]
[ 0 42 0 0 0 0]
[ 1 2 106 0 0 0]
[ 0 0 1 37 0 0]
[ 0 0 0 0 33 0]
[ 0 0 0 0 0 17]]
Czas trenowania i ewaluacji klasycznego SVM (pca_12): 1.39 sekund
Testowanie klasycznego SVM na wersji danych: pca_14
Wymiary danych: X_train (600, 14), X_test (258, 14)
Rozpoczęcie GridSearchCV dla pca_14...
Najlepsze parametry klasycznego SVM (pca_14): {'C': 0.1, 'gamma': 'scale', 'kernel': 'linear'}
Dokładność klasycznego SVM (pca_14): 0.9833
Raport klasyfikacji (klasyczny SVM - pca_14):
precision recall f1-score support
Astrocytoma, NOS 0.90 0.95 0.92 19
Astrocytoma, anaplastic 1.00 1.00 1.00 42
Glioblastoma 0.99 0.99 0.99 109
Mixed glioma 1.00 0.97 0.99 38
Oligodendroglioma, NOS 1.00 1.00 1.00 33
Oligodendroglioma, anaplastic 1.00 1.00 1.00 17
accuracy 0.99 258
macro avg 0.98 0.99 0.98 258
weighted avg 0.99 0.99 0.99 258
Szczegółowe metryki dla modelu Klasyczny SVM (pca_14):
Accuracy: 0.9884
Precision: 0.9888
Recall: 0.9884
F1 Score: 0.9885
ROC AUC: N/A
Macierz pomyłek:
[[ 18 0 1 0 0 0]
[ 0 42 0 0 0 0]
[ 1 0 108 0 0 0]
[ 1 0 0 37 0 0]
[ 0 0 0 0 33 0]
[ 0 0 0 0 0 17]]
Czas trenowania i ewaluacji klasycznego SVM (pca_14): 1.44 sekund
Testowanie klasycznego SVM na wersji danych: pca_16
Wymiary danych: X_train (600, 16), X_test (258, 16)
Rozpoczęcie GridSearchCV dla pca_16...
Najlepsze parametry klasycznego SVM (pca_16): {'C': 1, 'gamma': 'scale', 'kernel': 'linear'}
Dokładność klasycznego SVM (pca_16): 0.9867
Raport klasyfikacji (klasyczny SVM - pca_16):
precision recall f1-score support
Astrocytoma, NOS 0.90 0.95 0.92 19
Astrocytoma, anaplastic 1.00 0.98 0.99 42
Glioblastoma 0.99 0.99 0.99 109
Mixed glioma 1.00 1.00 1.00 38
Oligodendroglioma, NOS 1.00 1.00 1.00 33
Oligodendroglioma, anaplastic 1.00 1.00 1.00 17
accuracy 0.99 258
macro avg 0.98 0.99 0.98 258
weighted avg 0.99 0.99 0.99 258
Szczegółowe metryki dla modelu Klasyczny SVM (pca_16):
Accuracy: 0.9884
Precision: 0.9888
Recall: 0.9884
F1 Score: 0.9885
ROC AUC: N/A
Macierz pomyłek:
[[ 18 0 1 0 0 0]
[ 1 41 0 0 0 0]
[ 1 0 108 0 0 0]
[ 0 0 0 38 0 0]
[ 0 0 0 0 33 0]
[ 0 0 0 0 0 17]]
Czas trenowania i ewaluacji klasycznego SVM (pca_16): 1.44 sekund
Wyniki klasycznego SVM zapisane do: wyniki/dim_reduction/29082025-clean/classic_svm_results_TCGA_GBM_LGG_Mutations_clean.json
======= SVM Z JĄDREM KWANTOWYM =======
Brak wyników w cache, używanie tymczasowych wyników.
DEBUG - Wymiary danych treningowych: (600, 16)
Testowanie Amplitude_l2 z C=0.1...
Używanie kodowania amplitudowego z normalizacją l2...
Dokładność kwantowego SVM z Amplitude_l2, C=0.1: 0.7200 (czas: 4.17 s)
Testowanie Amplitude_l2 z C=1.0...
Używanie kodowania amplitudowego z normalizacją l2...
Dokładność kwantowego SVM z Amplitude_l2, C=1.0: 0.8967 (czas: 4.18 s)
Testowanie Amplitude_l2 z C=10.0...
Używanie kodowania amplitudowego z normalizacją l2...
Dokładność kwantowego SVM z Amplitude_l2, C=10.0: 0.9267 (czas: 4.18 s)
Testowanie Amplitude_l1 z C=0.1...
Używanie kodowania amplitudowego z normalizacją l1...
Dokładność kwantowego SVM z Amplitude_l1, C=0.1: 0.4183 (czas: 4.18 s)
Testowanie Amplitude_l1 z C=1.0...
Używanie kodowania amplitudowego z normalizacją l1...
Dokładność kwantowego SVM z Amplitude_l1, C=1.0: 0.4183 (czas: 4.17 s)
Testowanie Amplitude_l1 z C=10.0...
Używanie kodowania amplitudowego z normalizacją l1...
Dokładność kwantowego SVM z Amplitude_l1, C=10.0: 0.7317 (czas: 4.22 s)
Testowanie Amplitude_min-max z C=0.1...
Używanie kodowania amplitudowego z normalizacją min-max...
Dokładność kwantowego SVM z Amplitude_min-max, C=0.1: 0.7767 (czas: 4.31 s)
Testowanie Amplitude_min-max z C=1.0...
Używanie kodowania amplitudowego z normalizacją min-max...
Dokładność kwantowego SVM z Amplitude_min-max, C=1.0: 0.9533 (czas: 4.30 s)
Testowanie Amplitude_min-max z C=10.0...
Używanie kodowania amplitudowego z normalizacją min-max...
Dokładność kwantowego SVM z Amplitude_min-max, C=10.0: 0.9733 (czas: 4.26 s)
Najlepszy kwantowy SVM: Amplitude_min-max z C=10.0, dokładność: 0.9733
Ewaluacja najlepszego modelu z kodowaniem amplitudowym (normalizacja: min-max)...
Raport klasyfikacji (najlepszy kwantowy SVM z kodowaniem amplitudowym, normalizacja: min-max):
precision recall f1-score support
Astrocytoma, NOS 0.90 1.00 0.95 19
Astrocytoma, anaplastic 0.91 0.95 0.93 42
Glioblastoma 0.98 0.95 0.97 109
Mixed glioma 1.00 0.97 0.99 38
Oligodendroglioma, NOS 1.00 1.00 1.00 33
Oligodendroglioma, anaplastic 1.00 1.00 1.00 17
accuracy 0.97 258
macro avg 0.97 0.98 0.97 258
weighted avg 0.97 0.97 0.97 258
Szczegółowe metryki dla modelu Kwantowy SVM z kodowaniem amplitudowym (min-max):
Accuracy: 0.9690
Precision: 0.9702
Recall: 0.9690
F1 Score: 0.9692
ROC AUC: N/A
Macierz pomyłek:
[[ 19 0 0 0 0 0]
[ 0 40 2 0 0 0]
[ 1 4 104 0 0 0]
[ 1 0 0 37 0 0]
[ 0 0 0 0 33 0]
[ 0 0 0 0 0 17]]
Całkowity czas dla kwantowego SVM: 41.16 sekund
======= PODEJŚCIE HYBRYDOWE =======
Używanie mniejszego zbioru danych dla ewaluacji: (240, 16)
Tworzenie problemu QUBO dla optymalizacji hiperparametrów...
Używanie 3 map cech w podejściu hybrydowym: ['Amplitude_l2', 'Amplitude_l1', 'Amplitude_min-max']
Używanie wcześniej obliczonego wyniku dla Amplitude_l2, C=0.1: 0.7200
Używanie wcześniej obliczonego wyniku dla Amplitude_l2, C=1.0: 0.8967
Używanie wcześniej obliczonego wyniku dla Amplitude_l2, C=10.0: 0.9267
Używanie wcześniej obliczonego wyniku dla Amplitude_l1, C=0.1: 0.4183
Używanie wcześniej obliczonego wyniku dla Amplitude_l1, C=1.0: 0.4183
Używanie wcześniej obliczonego wyniku dla Amplitude_l1, C=10.0: 0.7317
Używanie wcześniej obliczonego wyniku dla Amplitude_min-max, C=0.1: 0.7767
Używanie wcześniej obliczonego wyniku dla Amplitude_min-max, C=1.0: 0.9533
Używanie wcześniej obliczonego wyniku dla Amplitude_min-max, C=10.0: 0.9733
Czas tworzenia problemu QUBO: 0.00 sekund
Rozwiązywanie problemu QUBO za pomocą wyżarzania kwantowego...
Czas wyżarzania kwantowego: 0.03 sekund
Optymalne hiperparametry z wyżarzania kwantowego: feature_map=Amplitude_min-max, C=10.0
Trenowanie modelu hybrydowego z kodowaniem amplitudowym (normalizacja: min-max)...
Czas trenowania modelu hybrydowego: 2.10 sekund
Czas ewaluacji modelu hybrydowego: 0.91 sekund
Dokładność ostatecznego modelu hybrydowego: 0.9690
Raport klasyfikacji (model hybrydowy):
precision recall f1-score support
Astrocytoma, NOS 0.90 1.00 0.95 19
Astrocytoma, anaplastic 0.91 0.95 0.93 42
Glioblastoma 0.98 0.95 0.97 109
Mixed glioma 1.00 0.97 0.99 38
Oligodendroglioma, NOS 1.00 1.00 1.00 33
Oligodendroglioma, anaplastic 1.00 1.00 1.00 17
accuracy 0.97 258
macro avg 0.97 0.98 0.97 258
weighted avg 0.97 0.97 0.97 258
Szczegółowe metryki dla modelu Model hybrydowy:
Accuracy: 0.9690
Precision: 0.9702
Recall: 0.9690
F1 Score: 0.9692
ROC AUC: N/A
Macierz pomyłek:
[[ 19 0 0 0 0 0]
[ 0 40 2 0 0 0]
[ 1 4 104 0 0 0]
[ 1 0 0 37 0 0]
[ 0 0 0 0 33 0]
[ 0 0 0 0 0 17]]
Całkowity czas dla podejścia hybrydowego: 3.07 sekund
======= PORÓWNANIE WYNIKÓW =======
Klasyczny SVM: 0.9883720930232558
Kwantowy SVM (bez wyżarzania): 0.9733
Model hybrydowy: 0.9690
======= PORÓWNANIE CZASÓW WYKONANIA =======
Czas przygotowania danych: 0.27 sekund
Czas klasycznego SVM: 1.44 sekund
Czas kwantowego SVM: 41.16 sekund
Czas podejścia hybrydowego: 3.07 sekund
======= ANALIZA ZNACZENIA CECH =======
Wytrenowanie modelu na oryginalnych danych do analizy znaczenia cech...
Najważniejsze cechy dla klasyfikacji:
Primary_Diagnosis_Glioblastoma: 0.2725
Primary_Diagnosis_Oligodendroglioma, NOS: 0.2221
Primary_Diagnosis_Mixed glioma: 0.2202
Primary_Diagnosis_Astrocytoma, anaplastic: 0.2198
Primary_Diagnosis_Oligodendroglioma, anaplastic: 0.1264
Czas analizy znaczenia cech: 3.03 sekund
======= KLUCZOWE MUTACJE ZWIĄZANE Z KLASYFIKACJĄ NOWOTWORÓW =======
Kluczowe mutacje:
Primary_Diagnosis_Glioblastoma: 0.2725
Primary_Diagnosis_Oligodendroglioma, NOS: 0.2221
Primary_Diagnosis_Mixed glioma: 0.2202
Primary_Diagnosis_Astrocytoma, anaplastic: 0.2198
Primary_Diagnosis_Oligodendroglioma, anaplastic: 0.1264
======= PODSUMOWANIE EKSPERYMENTU =======
Data i czas zakończenia: 2025-08-29 09:29:20
Całkowity czas eksperymentu: 56.29 sekund (0.94 minut)
======= PODSUMOWANIE METRYK =======
Klasyczny SVM:
accuracy: 0.9883720930232558
precision: 0.9887596899224806
recall: 0.9883720930232558
f1: 0.9884978195429303
roc_auc: N/A
Kwantowy SVM:
accuracy: 0.9689922480620154
precision: 0.9702158550337576
recall: 0.9689922480620154
f1: 0.9692413316507422
roc_auc: N/A
Model hybrydowy:
accuracy: 0.9689922480620154
precision: 0.9702158550337576
recall: 0.9689922480620154
f1: 0.9692413316507422
roc_auc: N/A