From 98186f6a03548bf192edc7acce21da3d70dd50ba Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Micha=C5=82=20Kasprowicz?= Date: Fri, 29 Aug 2025 07:13:27 +0000 Subject: [PATCH] Upload files to "wyniki/redukcja wymiarowosci/eksperyment 2" --- ..._results_TCGA_GBM_LGG_Mutations_clean.json | 398 ++++++++++++++ ..._results_TCGA_GBM_LGG_Mutations_clean.json | 67 +++ ...ts_cache_TCGA_GBM_LGG_Mutations_clean.json | 1 + ...BM_LGG_Mutations_clean_20250826_105344.txt | 505 ++++++++++++++++++ 4 files changed, 971 insertions(+) create mode 100644 wyniki/redukcja wymiarowosci/eksperyment 2/classic_svm_results_TCGA_GBM_LGG_Mutations_clean.json create mode 100644 wyniki/redukcja wymiarowosci/eksperyment 2/dimension_reduction_results_TCGA_GBM_LGG_Mutations_clean.json create mode 100644 wyniki/redukcja wymiarowosci/eksperyment 2/qsvm_results_cache_TCGA_GBM_LGG_Mutations_clean.json create mode 100644 wyniki/redukcja wymiarowosci/eksperyment 2/wyniki_svm_TCGA_GBM_LGG_Mutations_clean_20250826_105344.txt diff --git a/wyniki/redukcja wymiarowosci/eksperyment 2/classic_svm_results_TCGA_GBM_LGG_Mutations_clean.json b/wyniki/redukcja wymiarowosci/eksperyment 2/classic_svm_results_TCGA_GBM_LGG_Mutations_clean.json new file mode 100644 index 0000000..1cd00b2 --- /dev/null +++ b/wyniki/redukcja wymiarowosci/eksperyment 2/classic_svm_results_TCGA_GBM_LGG_Mutations_clean.json @@ -0,0 +1,398 @@ +{ + "default": { + "best_params": { + "C": 100, + "gamma": 0.01, + "kernel": "rbf" + }, + "best_score": 0.9500000000000001, + "metrics": { + "accuracy": 0.9418604651162791, + "precision": 0.9430795801020352, + "recall": 0.9418604651162791, + "f1": 0.9417604393109547, + "roc_auc": "N/A", + "confusion_matrix": [ + [ + 15, + 2, + 0, + 1, + 1, + 0 + ], + [ + 0, + 40, + 2, + 0, + 0, + 0 + ], + [ + 1, + 3, + 103, + 2, + 0, + 0 + ], + [ + 0, + 0, + 0, + 37, + 0, + 1 + ], + [ + 0, + 0, + 0, + 1, + 32, + 0 + ], + [ + 1, + 0, + 0, + 0, + 0, + 16 + ] + ] + }, + "execution_time": 1.2974693775177002 + }, + "pca_8": { + "best_params": { + "C": 100, + "gamma": 0.01, + "kernel": "rbf" + }, + "best_score": 0.9500000000000001, + "metrics": { + "accuracy": 0.9418604651162791, + "precision": 0.9430795801020352, + "recall": 0.9418604651162791, + "f1": 0.9417604393109547, + "roc_auc": "N/A", + "confusion_matrix": [ + [ + 15, + 2, + 0, + 1, + 1, + 0 + ], + [ + 0, + 40, + 2, + 0, + 0, + 0 + ], + [ + 1, + 3, + 103, + 2, + 0, + 0 + ], + [ + 0, + 0, + 0, + 37, + 0, + 1 + ], + [ + 0, + 0, + 0, + 1, + 32, + 0 + ], + [ + 1, + 0, + 0, + 0, + 0, + 16 + ] + ] + }, + "execution_time": 1.2923190593719482 + }, + "pca_10": { + "best_params": { + "C": 10, + "gamma": 0.01, + "kernel": "rbf" + }, + "best_score": 0.975, + "metrics": { + "accuracy": 0.9767441860465116, + "precision": 0.9769856184584866, + "recall": 0.9767441860465116, + "f1": 0.976722675775346, + "roc_auc": "N/A", + "confusion_matrix": [ + [ + 17, + 1, + 1, + 0, + 0, + 0 + ], + [ + 0, + 41, + 1, + 0, + 0, + 0 + ], + [ + 1, + 2, + 106, + 0, + 0, + 0 + ], + [ + 0, + 0, + 0, + 38, + 0, + 0 + ], + [ + 0, + 0, + 0, + 0, + 33, + 0 + ], + [ + 0, + 0, + 0, + 0, + 0, + 17 + ] + ] + }, + "execution_time": 1.2386040687561035 + }, + "pca_12": { + "best_params": { + "C": 10, + "gamma": 0.01, + "kernel": "rbf" + }, + "best_score": 0.9816666666666668, + "metrics": { + "accuracy": 0.9806201550387597, + "precision": 0.9809007386526767, + "recall": 0.9806201550387597, + "f1": 0.9806398000386033, + "roc_auc": "N/A", + "confusion_matrix": [ + [ + 18, + 0, + 1, + 0, + 0, + 0 + ], + [ + 0, + 42, + 0, + 0, + 0, + 0 + ], + [ + 1, + 2, + 106, + 0, + 0, + 0 + ], + [ + 0, + 0, + 1, + 37, + 0, + 0 + ], + [ + 0, + 0, + 0, + 0, + 33, + 0 + ], + [ + 0, + 0, + 0, + 0, + 0, + 17 + ] + ] + }, + "execution_time": 1.2703914642333984 + }, + "pca_14": { + "best_params": { + "C": 0.1, + "gamma": "scale", + "kernel": "linear" + }, + "best_score": 0.9833333333333334, + "metrics": { + "accuracy": 0.9883720930232558, + "precision": 0.9887596899224806, + "recall": 0.9883720930232558, + "f1": 0.9884953289604453, + "roc_auc": "N/A", + "confusion_matrix": [ + [ + 18, + 0, + 1, + 0, + 0, + 0 + ], + [ + 0, + 42, + 0, + 0, + 0, + 0 + ], + [ + 1, + 0, + 108, + 0, + 0, + 0 + ], + [ + 1, + 0, + 0, + 37, + 0, + 0 + ], + [ + 0, + 0, + 0, + 0, + 33, + 0 + ], + [ + 0, + 0, + 0, + 0, + 0, + 17 + ] + ] + }, + "execution_time": 1.3830502033233643 + }, + "pca_16": { + "best_params": { + "C": 100, + "gamma": 0.01, + "kernel": "rbf" + }, + "best_score": 0.9916666666666667, + "metrics": { + "accuracy": 0.9767441860465116, + "precision": 0.9780563106144502, + "recall": 0.9767441860465116, + "f1": 0.9770045777038696, + "roc_auc": "N/A", + "confusion_matrix": [ + [ + 18, + 0, + 1, + 0, + 0, + 0 + ], + [ + 0, + 42, + 0, + 0, + 0, + 0 + ], + [ + 3, + 2, + 104, + 0, + 0, + 0 + ], + [ + 0, + 0, + 0, + 38, + 0, + 0 + ], + [ + 0, + 0, + 0, + 0, + 33, + 0 + ], + [ + 0, + 0, + 0, + 0, + 0, + 17 + ] + ] + }, + "execution_time": 1.503495216369629 + } +} \ No newline at end of file diff --git a/wyniki/redukcja wymiarowosci/eksperyment 2/dimension_reduction_results_TCGA_GBM_LGG_Mutations_clean.json b/wyniki/redukcja wymiarowosci/eksperyment 2/dimension_reduction_results_TCGA_GBM_LGG_Mutations_clean.json new file mode 100644 index 0000000..c75efb1 --- /dev/null +++ b/wyniki/redukcja wymiarowosci/eksperyment 2/dimension_reduction_results_TCGA_GBM_LGG_Mutations_clean.json @@ -0,0 +1,67 @@ +[ + { + "method": "PCA", + "parameters": { + "n_components": 8 + }, + "dimensions": [ + 858, + 8 + ], + "explained_variance": 0.4687167856431779, + "execution_time": 0.011238574981689453, + "version_name": "pca_8" + }, + { + "method": "PCA", + "parameters": { + "n_components": 10 + }, + "dimensions": [ + 858, + 10 + ], + "explained_variance": 0.5409859757114897, + "execution_time": 0.011492490768432617, + "version_name": "pca_10" + }, + { + "method": "PCA", + "parameters": { + "n_components": 12 + }, + "dimensions": [ + 858, + 12 + ], + "explained_variance": 0.6090170144380542, + "execution_time": 0.016751527786254883, + "version_name": "pca_12" + }, + { + "method": "PCA", + "parameters": { + "n_components": 14 + }, + "dimensions": [ + 858, + 14 + ], + "explained_variance": 0.6727583280061241, + "execution_time": 0.016129255294799805, + "version_name": "pca_14" + }, + { + "method": "PCA", + "parameters": { + "n_components": 16 + }, + "dimensions": [ + 858, + 16 + ], + "explained_variance": 0.7342437580434953, + "execution_time": 0.032947540283203125, + "version_name": "pca_16" + } +] \ No newline at end of file diff --git a/wyniki/redukcja wymiarowosci/eksperyment 2/qsvm_results_cache_TCGA_GBM_LGG_Mutations_clean.json b/wyniki/redukcja wymiarowosci/eksperyment 2/qsvm_results_cache_TCGA_GBM_LGG_Mutations_clean.json new file mode 100644 index 0000000..755ef09 --- /dev/null +++ b/wyniki/redukcja wymiarowosci/eksperyment 2/qsvm_results_cache_TCGA_GBM_LGG_Mutations_clean.json @@ -0,0 +1 @@ +{"quantum_results": [["Amplitude_l2", 0.1, 0.7416666666666667], ["Amplitude_l2", 1.0, 0.8516666666666667], ["Amplitude_l2", 10.0, 0.87], ["Amplitude_l1", 0.1, 0.4183333333333334], ["Amplitude_l1", 1.0, 0.45], ["Amplitude_l1", 10.0, 0.835], ["Amplitude_min-max", 0.1, 0.79], ["Amplitude_min-max", 1.0, 0.8816666666666667], ["Amplitude_min-max", 10.0, 0.93]], "quantum_times": {"Amplitude_l2_0.1": {"total_time": 4.137783527374268, "cv_time": 4.137712717056274}, "Amplitude_l2_1.0": {"total_time": 4.097283124923706, "cv_time": 4.097202777862549}, "Amplitude_l2_10.0": {"total_time": 4.088233232498169, "cv_time": 4.088153600692749}, "Amplitude_l1_0.1": {"total_time": 4.094529867172241, "cv_time": 4.094449043273926}, "Amplitude_l1_1.0": {"total_time": 4.0805604457855225, "cv_time": 4.080477714538574}, "Amplitude_l1_10.0": {"total_time": 4.091708183288574, "cv_time": 4.091616153717041}, "Amplitude_min-max_0.1": {"total_time": 4.173805236816406, "cv_time": 4.173725128173828}, "Amplitude_min-max_1.0": {"total_time": 4.246448755264282, "cv_time": 4.246363401412964}, "Amplitude_min-max_10.0": {"total_time": 4.203169584274292, "cv_time": 4.203083753585815}}, "completed_feature_maps": [], "hybrid_scores": {}, "hybrid_eval_times": {}} \ No newline at end of file diff --git a/wyniki/redukcja wymiarowosci/eksperyment 2/wyniki_svm_TCGA_GBM_LGG_Mutations_clean_20250826_105344.txt b/wyniki/redukcja wymiarowosci/eksperyment 2/wyniki_svm_TCGA_GBM_LGG_Mutations_clean_20250826_105344.txt new file mode 100644 index 0000000..eadef7e --- /dev/null +++ b/wyniki/redukcja wymiarowosci/eksperyment 2/wyniki_svm_TCGA_GBM_LGG_Mutations_clean_20250826_105344.txt @@ -0,0 +1,505 @@ +======= ROZPOCZĘCIE EKSPERYMENTU DLA PLIKU: dane/TCGA_GBM_LGG_Mutations_clean.csv ======= +Wyniki będą zapisane w: wyniki/dim_reduction/23082025-clean/wyniki_svm_TCGA_GBM_LGG_Mutations_clean_20250826_105344.txt +======= INFORMACJE O ŚRODOWISKU ======= +Data i czas rozpoczęcia: 2025-08-26 10:53:44 +Wersja NumPy: 1.24.3 +Wersja Pandas: 2.0.3 +Wersja scikit-learn: 1.3.0 +Wersja Qiskit: 0.25.1 +Wersja qiskit-machine-learning: 0.6.0 +Wersja dimod: 0.12.20 +Wersja neal: 0.6.0 + +======= WYBRANE EKSPERYMENTY ======= +Klasyczny SVM: TAK +Kwantowy SVM: TAK +Podejście hybrydowe: TAK + +======= AKTYWOWANE MAPY CECH ======= +ZZ1: NIE +ZZ2: NIE +Pauli1: NIE +Pauli2: NIE +Z1: NIE +Z2: NIE +ZZ1_new: NIE +ZZ2_new: NIE +Amplitude_l2: TAK +Amplitude_l1: TAK +Amplitude_min-max: TAK + +======= PRZYGOTOWANIE DANYCH ======= +Wymiary oryginalnych danych: (858, 27) +Unikalne wartości zmiennej docelowej: ['Oligodendroglioma, NOS' 'Mixed glioma' 'Astrocytoma, NOS' + 'Astrocytoma, anaplastic' 'Oligodendroglioma, anaplastic' 'Glioblastoma'] +Rozkład klas: {'Glioblastoma': 360, 'Astrocytoma, anaplastic': 129, 'Mixed glioma': 128, 'Oligodendroglioma, NOS': 108, 'Oligodendroglioma, anaplastic': 75, 'Astrocytoma, NOS': 58} +Wymiary danych po usunięciu kolumn identyfikacyjnych: (858, 24) +Przekształcanie kolumn kategorycznych na binarne... +Kolumny kategoryczne do przekształcenia: ['Gender', 'Primary_Diagnosis', 'Race', 'IDH1', 'TP53', 'ATRX', 'PTEN', 'EGFR', 'CIC', 'MUC16', 'PIK3CA', 'NF1', 'PIK3R1', 'FUBP1', 'RB1', 'NOTCH1', 'BCOR', 'CSMD3', 'SMARCA4', 'GRIN2A', 'IDH2', 'FAT4', 'PDGFRA'] +Kolumna Gender zawiera wartości: ['Male' 'Female'] +Kolumna Primary_Diagnosis zawiera wartości: ['Oligodendroglioma, NOS' 'Mixed glioma' 'Astrocytoma, NOS' + 'Astrocytoma, anaplastic' 'Oligodendroglioma, anaplastic' 'Glioblastoma'] +Kolumna Primary_Diagnosis zostanie zakodowana jako one-hot. +Kolumna Race zawiera wartości: ['white' 'asian' 'black or african american' 'not reported' + 'american indian or alaska native'] +Kolumna Race zostanie zakodowana jako one-hot. +Kolumna IDH1 zawiera wartości: ['MUTATED' 'NOT_MUTATED'] +Kolumna TP53 zawiera wartości: ['NOT_MUTATED' 'MUTATED'] +Kolumna ATRX zawiera wartości: ['NOT_MUTATED' 'MUTATED'] +Kolumna PTEN zawiera wartości: ['NOT_MUTATED' 'MUTATED'] +Kolumna EGFR zawiera wartości: ['NOT_MUTATED' 'MUTATED'] +Kolumna CIC zawiera wartości: ['NOT_MUTATED' 'MUTATED'] +Kolumna MUC16 zawiera wartości: ['NOT_MUTATED' 'MUTATED'] +Kolumna PIK3CA zawiera wartości: ['MUTATED' 'NOT_MUTATED'] +Kolumna NF1 zawiera wartości: ['NOT_MUTATED' 'MUTATED'] +Kolumna PIK3R1 zawiera wartości: ['NOT_MUTATED' 'MUTATED'] +Kolumna FUBP1 zawiera wartości: ['MUTATED' 'NOT_MUTATED'] +Kolumna RB1 zawiera wartości: ['NOT_MUTATED' 'MUTATED'] +Kolumna NOTCH1 zawiera wartości: ['NOT_MUTATED' 'MUTATED'] +Kolumna BCOR zawiera wartości: ['NOT_MUTATED' 'MUTATED'] +Kolumna CSMD3 zawiera wartości: ['NOT_MUTATED' 'MUTATED'] +Kolumna SMARCA4 zawiera wartości: ['NOT_MUTATED' 'MUTATED'] +Kolumna GRIN2A zawiera wartości: ['NOT_MUTATED' 'MUTATED'] +Kolumna IDH2 zawiera wartości: ['NOT_MUTATED' 'MUTATED'] +Kolumna FAT4 zawiera wartości: ['NOT_MUTATED' 'MUTATED'] +Kolumna PDGFRA zawiera wartości: ['NOT_MUTATED' 'MUTATED'] +Wymiary danych po przekształceniu: (858, 31) +Wypełnianie brakujących wartości... +Wymiary danych wejściowych: (858, 31) +Wymiary danych po skalowaniu: (858, 31) + +======= REDUKCJA WYMIAROWOŚCI ======= + +Testowanie PCA z 8 komponentami... +Wymiary danych po redukcji PCA: (858, 8) +Wyjaśniona wariancja: 0.4687 +Czas wykonania PCA: 0.01 sekund + +Testowanie PCA z 10 komponentami... +Wymiary danych po redukcji PCA: (858, 10) +Wyjaśniona wariancja: 0.5410 +Czas wykonania PCA: 0.01 sekund + +Testowanie PCA z 12 komponentami... +Wymiary danych po redukcji PCA: (858, 12) +Wyjaśniona wariancja: 0.6090 +Czas wykonania PCA: 0.02 sekund + +Testowanie PCA z 14 komponentami... +Wymiary danych po redukcji PCA: (858, 14) +Wyjaśniona wariancja: 0.6728 +Czas wykonania PCA: 0.02 sekund + +Testowanie PCA z 16 komponentami... +Wymiary danych po redukcji PCA: (858, 16) +Wyjaśniona wariancja: 0.7342 +Czas wykonania PCA: 0.03 sekund + +Wyniki redukcji wymiarowości zapisane do: wyniki/dim_reduction/23082025-clean/dimension_reduction_results_TCGA_GBM_LGG_Mutations_clean.json + +Wybrano najlepszą wersję redukcji wymiarowości: pca_8 +Wymiary domyślnego zbioru treningowego: (600, 8) +Wymiary domyślnego zbioru testowego: (258, 8) + +Dostępne wersje zredukowanych danych: + pca_8: Train (600, 8), Test (258, 8) + pca_10: Train (600, 10), Test (258, 10) + pca_12: Train (600, 12), Test (258, 12) + pca_14: Train (600, 14), Test (258, 14) + pca_16: Train (600, 16), Test (258, 16) + +Czas przygotowania danych: 0.16 sekund + +======= KLASYCZNY SVM (BASELINE) ======= + +Testowanie klasycznego SVM na wersji danych: default +Wymiary danych: X_train (600, 8), X_test (258, 8) +Rozpoczęcie GridSearchCV dla default... +Najlepsze parametry klasycznego SVM (default): {'C': 100, 'gamma': 0.01, 'kernel': 'rbf'} +Dokładność klasycznego SVM (default): 0.9500 +Raport klasyfikacji (klasyczny SVM - default): + precision recall f1-score support + + Astrocytoma, NOS 0.88 0.79 0.83 19 + Astrocytoma, anaplastic 0.89 0.95 0.92 42 + Glioblastoma 0.98 0.94 0.96 109 + Mixed glioma 0.90 0.97 0.94 38 + Oligodendroglioma, NOS 0.97 0.97 0.97 33 +Oligodendroglioma, anaplastic 0.94 0.94 0.94 17 + + accuracy 0.94 258 + macro avg 0.93 0.93 0.93 258 + weighted avg 0.94 0.94 0.94 258 + + +Szczegółowe metryki dla modelu Klasyczny SVM (default): +Accuracy: 0.9419 +Precision: 0.9431 +Recall: 0.9419 +F1 Score: 0.9418 +ROC AUC: N/A + +Macierz pomyłek: +[[ 15 2 0 1 1 0] + [ 0 40 2 0 0 0] + [ 1 3 103 2 0 0] + [ 0 0 0 37 0 1] + [ 0 0 0 1 32 0] + [ 1 0 0 0 0 16]] +Czas trenowania i ewaluacji klasycznego SVM (default): 1.30 sekund + +Testowanie klasycznego SVM na wersji danych: pca_8 +Wymiary danych: X_train (600, 8), X_test (258, 8) +Rozpoczęcie GridSearchCV dla pca_8... +Najlepsze parametry klasycznego SVM (pca_8): {'C': 100, 'gamma': 0.01, 'kernel': 'rbf'} +Dokładność klasycznego SVM (pca_8): 0.9500 +Raport klasyfikacji (klasyczny SVM - pca_8): + precision recall f1-score support + + Astrocytoma, NOS 0.88 0.79 0.83 19 + Astrocytoma, anaplastic 0.89 0.95 0.92 42 + Glioblastoma 0.98 0.94 0.96 109 + Mixed glioma 0.90 0.97 0.94 38 + Oligodendroglioma, NOS 0.97 0.97 0.97 33 +Oligodendroglioma, anaplastic 0.94 0.94 0.94 17 + + accuracy 0.94 258 + macro avg 0.93 0.93 0.93 258 + weighted avg 0.94 0.94 0.94 258 + + +Szczegółowe metryki dla modelu Klasyczny SVM (pca_8): +Accuracy: 0.9419 +Precision: 0.9431 +Recall: 0.9419 +F1 Score: 0.9418 +ROC AUC: N/A + +Macierz pomyłek: +[[ 15 2 0 1 1 0] + [ 0 40 2 0 0 0] + [ 1 3 103 2 0 0] + [ 0 0 0 37 0 1] + [ 0 0 0 1 32 0] + [ 1 0 0 0 0 16]] +Czas trenowania i ewaluacji klasycznego SVM (pca_8): 1.29 sekund + +Testowanie klasycznego SVM na wersji danych: pca_10 +Wymiary danych: X_train (600, 10), X_test (258, 10) +Rozpoczęcie GridSearchCV dla pca_10... +Najlepsze parametry klasycznego SVM (pca_10): {'C': 10, 'gamma': 0.01, 'kernel': 'rbf'} +Dokładność klasycznego SVM (pca_10): 0.9750 +Raport klasyfikacji (klasyczny SVM - pca_10): + precision recall f1-score support + + Astrocytoma, NOS 0.94 0.89 0.92 19 + Astrocytoma, anaplastic 0.93 0.98 0.95 42 + Glioblastoma 0.98 0.97 0.98 109 + Mixed glioma 1.00 1.00 1.00 38 + Oligodendroglioma, NOS 1.00 1.00 1.00 33 +Oligodendroglioma, anaplastic 1.00 1.00 1.00 17 + + accuracy 0.98 258 + macro avg 0.98 0.97 0.97 258 + weighted avg 0.98 0.98 0.98 258 + + +Szczegółowe metryki dla modelu Klasyczny SVM (pca_10): +Accuracy: 0.9767 +Precision: 0.9770 +Recall: 0.9767 +F1 Score: 0.9767 +ROC AUC: N/A + +Macierz pomyłek: +[[ 17 1 1 0 0 0] + [ 0 41 1 0 0 0] + [ 1 2 106 0 0 0] + [ 0 0 0 38 0 0] + [ 0 0 0 0 33 0] + [ 0 0 0 0 0 17]] +Czas trenowania i ewaluacji klasycznego SVM (pca_10): 1.24 sekund + +Testowanie klasycznego SVM na wersji danych: pca_12 +Wymiary danych: X_train (600, 12), X_test (258, 12) +Rozpoczęcie GridSearchCV dla pca_12... +Najlepsze parametry klasycznego SVM (pca_12): {'C': 10, 'gamma': 0.01, 'kernel': 'rbf'} +Dokładność klasycznego SVM (pca_12): 0.9817 +Raport klasyfikacji (klasyczny SVM - pca_12): + precision recall f1-score support + + Astrocytoma, NOS 0.95 0.95 0.95 19 + Astrocytoma, anaplastic 0.95 1.00 0.98 42 + Glioblastoma 0.98 0.97 0.98 109 + Mixed glioma 1.00 0.97 0.99 38 + Oligodendroglioma, NOS 1.00 1.00 1.00 33 +Oligodendroglioma, anaplastic 1.00 1.00 1.00 17 + + accuracy 0.98 258 + macro avg 0.98 0.98 0.98 258 + weighted avg 0.98 0.98 0.98 258 + + +Szczegółowe metryki dla modelu Klasyczny SVM (pca_12): +Accuracy: 0.9806 +Precision: 0.9809 +Recall: 0.9806 +F1 Score: 0.9806 +ROC AUC: N/A + +Macierz pomyłek: +[[ 18 0 1 0 0 0] + [ 0 42 0 0 0 0] + [ 1 2 106 0 0 0] + [ 0 0 1 37 0 0] + [ 0 0 0 0 33 0] + [ 0 0 0 0 0 17]] +Czas trenowania i ewaluacji klasycznego SVM (pca_12): 1.27 sekund + +Testowanie klasycznego SVM na wersji danych: pca_14 +Wymiary danych: X_train (600, 14), X_test (258, 14) +Rozpoczęcie GridSearchCV dla pca_14... +Najlepsze parametry klasycznego SVM (pca_14): {'C': 0.1, 'gamma': 'scale', 'kernel': 'linear'} +Dokładność klasycznego SVM (pca_14): 0.9833 +Raport klasyfikacji (klasyczny SVM - pca_14): + precision recall f1-score support + + Astrocytoma, NOS 0.90 0.95 0.92 19 + Astrocytoma, anaplastic 1.00 1.00 1.00 42 + Glioblastoma 0.99 0.99 0.99 109 + Mixed glioma 1.00 0.97 0.99 38 + Oligodendroglioma, NOS 1.00 1.00 1.00 33 +Oligodendroglioma, anaplastic 1.00 1.00 1.00 17 + + accuracy 0.99 258 + macro avg 0.98 0.99 0.98 258 + weighted avg 0.99 0.99 0.99 258 + + +Szczegółowe metryki dla modelu Klasyczny SVM (pca_14): +Accuracy: 0.9884 +Precision: 0.9888 +Recall: 0.9884 +F1 Score: 0.9885 +ROC AUC: N/A + +Macierz pomyłek: +[[ 18 0 1 0 0 0] + [ 0 42 0 0 0 0] + [ 1 0 108 0 0 0] + [ 1 0 0 37 0 0] + [ 0 0 0 0 33 0] + [ 0 0 0 0 0 17]] +Czas trenowania i ewaluacji klasycznego SVM (pca_14): 1.38 sekund + +Testowanie klasycznego SVM na wersji danych: pca_16 +Wymiary danych: X_train (600, 16), X_test (258, 16) +Rozpoczęcie GridSearchCV dla pca_16... +Najlepsze parametry klasycznego SVM (pca_16): {'C': 100, 'gamma': 0.01, 'kernel': 'rbf'} +Dokładność klasycznego SVM (pca_16): 0.9917 +Raport klasyfikacji (klasyczny SVM - pca_16): + precision recall f1-score support + + Astrocytoma, NOS 0.86 0.95 0.90 19 + Astrocytoma, anaplastic 0.95 1.00 0.98 42 + Glioblastoma 0.99 0.95 0.97 109 + Mixed glioma 1.00 1.00 1.00 38 + Oligodendroglioma, NOS 1.00 1.00 1.00 33 +Oligodendroglioma, anaplastic 1.00 1.00 1.00 17 + + accuracy 0.98 258 + macro avg 0.97 0.98 0.97 258 + weighted avg 0.98 0.98 0.98 258 + + +Szczegółowe metryki dla modelu Klasyczny SVM (pca_16): +Accuracy: 0.9767 +Precision: 0.9781 +Recall: 0.9767 +F1 Score: 0.9770 +ROC AUC: N/A + +Macierz pomyłek: +[[ 18 0 1 0 0 0] + [ 0 42 0 0 0 0] + [ 3 2 104 0 0 0] + [ 0 0 0 38 0 0] + [ 0 0 0 0 33 0] + [ 0 0 0 0 0 17]] +Czas trenowania i ewaluacji klasycznego SVM (pca_16): 1.50 sekund + +Wyniki klasycznego SVM zapisane do: wyniki/dim_reduction/23082025-clean/classic_svm_results_TCGA_GBM_LGG_Mutations_clean.json + +======= SVM Z JĄDREM KWANTOWYM ======= +Brak wyników w cache, używanie tymczasowych wyników. + +DEBUG - Wymiary danych treningowych: (600, 8) +Testowanie Amplitude_l2 z C=0.1... +Używanie kodowania amplitudowego z normalizacją l2... +Dokładność kwantowego SVM z Amplitude_l2, C=0.1: 0.7417 (czas: 4.14 s) +Testowanie Amplitude_l2 z C=1.0... +Używanie kodowania amplitudowego z normalizacją l2... +Dokładność kwantowego SVM z Amplitude_l2, C=1.0: 0.8517 (czas: 4.10 s) +Testowanie Amplitude_l2 z C=10.0... +Używanie kodowania amplitudowego z normalizacją l2... +Dokładność kwantowego SVM z Amplitude_l2, C=10.0: 0.8700 (czas: 4.09 s) +Testowanie Amplitude_l1 z C=0.1... +Używanie kodowania amplitudowego z normalizacją l1... +Dokładność kwantowego SVM z Amplitude_l1, C=0.1: 0.4183 (czas: 4.09 s) +Testowanie Amplitude_l1 z C=1.0... +Używanie kodowania amplitudowego z normalizacją l1... +Dokładność kwantowego SVM z Amplitude_l1, C=1.0: 0.4500 (czas: 4.08 s) +Testowanie Amplitude_l1 z C=10.0... +Używanie kodowania amplitudowego z normalizacją l1... +Dokładność kwantowego SVM z Amplitude_l1, C=10.0: 0.8350 (czas: 4.09 s) +Testowanie Amplitude_min-max z C=0.1... +Używanie kodowania amplitudowego z normalizacją min-max... +Dokładność kwantowego SVM z Amplitude_min-max, C=0.1: 0.7900 (czas: 4.17 s) +Testowanie Amplitude_min-max z C=1.0... +Używanie kodowania amplitudowego z normalizacją min-max... +Dokładność kwantowego SVM z Amplitude_min-max, C=1.0: 0.8817 (czas: 4.25 s) +Testowanie Amplitude_min-max z C=10.0... +Używanie kodowania amplitudowego z normalizacją min-max... +Dokładność kwantowego SVM z Amplitude_min-max, C=10.0: 0.9300 (czas: 4.20 s) +Najlepszy kwantowy SVM: Amplitude_min-max z C=10.0, dokładność: 0.9300 +Ewaluacja najlepszego modelu z kodowaniem amplitudowym (normalizacja: min-max)... +Raport klasyfikacji (najlepszy kwantowy SVM z kodowaniem amplitudowym, normalizacja: min-max): + precision recall f1-score support + + Astrocytoma, NOS 0.89 0.89 0.89 19 + Astrocytoma, anaplastic 0.86 0.90 0.88 42 + Glioblastoma 0.95 0.96 0.96 109 + Mixed glioma 0.95 0.95 0.95 38 + Oligodendroglioma, NOS 1.00 0.97 0.98 33 +Oligodendroglioma, anaplastic 0.93 0.82 0.87 17 + + accuracy 0.94 258 + macro avg 0.93 0.92 0.92 258 + weighted avg 0.94 0.94 0.94 258 + + +Szczegółowe metryki dla modelu Kwantowy SVM z kodowaniem amplitudowym (min-max): +Accuracy: 0.9380 +Precision: 0.9387 +Recall: 0.9380 +F1 Score: 0.9380 +ROC AUC: N/A + +Macierz pomyłek: +[[ 17 2 0 0 0 0] + [ 0 38 4 0 0 0] + [ 1 3 105 0 0 0] + [ 0 0 1 36 0 1] + [ 1 0 0 0 32 0] + [ 0 1 0 2 0 14]] + +Całkowity czas dla kwantowego SVM: 40.34 sekund + +======= PODEJŚCIE HYBRYDOWE ======= +Używanie mniejszego zbioru danych dla ewaluacji: (240, 8) +Tworzenie problemu QUBO dla optymalizacji hiperparametrów... +Używanie 3 map cech w podejściu hybrydowym: ['Amplitude_l2', 'Amplitude_l1', 'Amplitude_min-max'] +Używanie wcześniej obliczonego wyniku dla Amplitude_l2, C=0.1: 0.7417 +Używanie wcześniej obliczonego wyniku dla Amplitude_l2, C=1.0: 0.8517 +Używanie wcześniej obliczonego wyniku dla Amplitude_l2, C=10.0: 0.8700 +Używanie wcześniej obliczonego wyniku dla Amplitude_l1, C=0.1: 0.4183 +Używanie wcześniej obliczonego wyniku dla Amplitude_l1, C=1.0: 0.4500 +Używanie wcześniej obliczonego wyniku dla Amplitude_l1, C=10.0: 0.8350 +Używanie wcześniej obliczonego wyniku dla Amplitude_min-max, C=0.1: 0.7900 +Używanie wcześniej obliczonego wyniku dla Amplitude_min-max, C=1.0: 0.8817 +Używanie wcześniej obliczonego wyniku dla Amplitude_min-max, C=10.0: 0.9300 +Czas tworzenia problemu QUBO: 0.00 sekund +Rozwiązywanie problemu QUBO za pomocą wyżarzania kwantowego... +Czas wyżarzania kwantowego: 0.03 sekund +Optymalne hiperparametry z wyżarzania kwantowego: feature_map=Amplitude_min-max, C=10.0 +Trenowanie modelu hybrydowego z kodowaniem amplitudowym (normalizacja: min-max)... +Czas trenowania modelu hybrydowego: 2.07 sekund +Czas ewaluacji modelu hybrydowego: 0.90 sekund +Dokładność ostatecznego modelu hybrydowego: 0.9380 +Raport klasyfikacji (model hybrydowy): + precision recall f1-score support + + Astrocytoma, NOS 0.89 0.89 0.89 19 + Astrocytoma, anaplastic 0.86 0.90 0.88 42 + Glioblastoma 0.95 0.96 0.96 109 + Mixed glioma 0.95 0.95 0.95 38 + Oligodendroglioma, NOS 1.00 0.97 0.98 33 +Oligodendroglioma, anaplastic 0.93 0.82 0.87 17 + + accuracy 0.94 258 + macro avg 0.93 0.92 0.92 258 + weighted avg 0.94 0.94 0.94 258 + + +Szczegółowe metryki dla modelu Model hybrydowy: +Accuracy: 0.9380 +Precision: 0.9387 +Recall: 0.9380 +F1 Score: 0.9380 +ROC AUC: N/A + +Macierz pomyłek: +[[ 17 2 0 0 0 0] + [ 0 38 4 0 0 0] + [ 1 3 105 0 0 0] + [ 0 0 1 36 0 1] + [ 1 0 0 0 32 0] + [ 0 1 0 2 0 14]] + +Całkowity czas dla podejścia hybrydowego: 3.03 sekund + +======= PORÓWNANIE WYNIKÓW ======= +Klasyczny SVM: 0.9767441860465116 +Kwantowy SVM (bez wyżarzania): 0.9300 +Model hybrydowy: 0.9380 + +======= PORÓWNANIE CZASÓW WYKONANIA ======= +Czas przygotowania danych: 0.16 sekund +Czas klasycznego SVM: 1.50 sekund +Czas kwantowego SVM: 40.34 sekund +Czas podejścia hybrydowego: 3.03 sekund + +======= ANALIZA ZNACZENIA CECH ======= +Wytrenowanie modelu na oryginalnych danych do analizy znaczenia cech... +Najważniejsze cechy dla klasyfikacji: + Primary_Diagnosis_Glioblastoma: 0.2725 + Primary_Diagnosis_Oligodendroglioma, NOS: 0.2221 + Primary_Diagnosis_Mixed glioma: 0.2202 + Primary_Diagnosis_Astrocytoma, anaplastic: 0.2198 + Primary_Diagnosis_Oligodendroglioma, anaplastic: 0.1264 + +Czas analizy znaczenia cech: 3.04 sekund + +======= KLUCZOWE MUTACJE ZWIĄZANE Z KLASYFIKACJĄ NOWOTWORÓW ======= +Kluczowe mutacje: + Primary_Diagnosis_Glioblastoma: 0.2725 + Primary_Diagnosis_Oligodendroglioma, NOS: 0.2221 + Primary_Diagnosis_Mixed glioma: 0.2202 + Primary_Diagnosis_Astrocytoma, anaplastic: 0.2198 + Primary_Diagnosis_Oligodendroglioma, anaplastic: 0.1264 + +======= PODSUMOWANIE EKSPERYMENTU ======= +Data i czas zakończenia: 2025-08-26 10:54:39 +Całkowity czas eksperymentu: 54.65 sekund (0.91 minut) + +======= PODSUMOWANIE METRYK ======= +Klasyczny SVM: + accuracy: 0.9767441860465116 + precision: 0.9780563106144502 + recall: 0.9767441860465116 + f1: 0.9770045777038696 + roc_auc: N/A + +Kwantowy SVM: + accuracy: 0.937984496124031 + precision: 0.9387009631195677 + recall: 0.937984496124031 + f1: 0.9380005221212427 + roc_auc: N/A + +Model hybrydowy: + accuracy: 0.937984496124031 + precision: 0.9387009631195677 + recall: 0.937984496124031 + f1: 0.9380005221212427 + roc_auc: N/A