Genomic_data_QSVM/wyniki/eksperymenty poboczne/wyniki_eksperymentow_Primar...

220 lines
7.5 KiB
Plaintext

======= INFORMACJE O ŚRODOWISKU =======
Data i czas rozpoczęcia: 2025-08-20 15:33:20
Wersja NumPy: 1.24.3
Wersja Pandas: 2.0.3
Wersja scikit-learn: 1.3.0
Wersja Qiskit: 0.25.1
Wersja qiskit-machine-learning: 0.6.0
Wersja dimod: 0.12.20
Wersja neal: 0.6.0
======= WYBRANE EKSPERYMENTY =======
Eksperyment 1 (Wpływ złożoności danych): TAK
Eksperyment 2 (Podzbiory genów): TAK
Eksperyment 3 (Mapowania cech): TAK
======= WCZYTYWANIE DANYCH =======
Czas wczytywania danych: 0.01 sekund
Wymiary danych: (858, 27)
======= STRUKTURA DANYCH =======
Kolumny w zbiorze danych: ['Grade', 'Project', 'Case_ID', 'Gender', 'Age_at_diagnosis']...
Typy danych w kolumnach:
Grade object
Project object
Case_ID object
Gender object
Age_at_diagnosis object
dtype: object
Przykładowe dane:
Grade Project Case_ID Gender ... GRIN2A IDH2 FAT4 PDGFRA
0 LGG TCGA-LGG TCGA-DU-8164 Male ... NOT_MUTATED NOT_MUTATED NOT_MUTATED NOT_MUTATED
1 LGG TCGA-LGG TCGA-QH-A6CY Male ... NOT_MUTATED NOT_MUTATED NOT_MUTATED NOT_MUTATED
[2 rows x 27 columns]
Unikalne wartości w kolumnie 'Primary_Diagnosis': ['Oligodendroglioma, NOS' 'Mixed glioma' 'Astrocytoma, NOS'
'Astrocytoma, anaplastic' 'Oligodendroglioma, anaplastic' 'Glioblastoma']
Liczba próbek dla każdej klasy:
Primary_Diagnosis
Glioblastoma 360
Astrocytoma, anaplastic 129
Mixed glioma 128
Oligodendroglioma, NOS 108
Oligodendroglioma, anaplastic 75
Astrocytoma, NOS 58
Name: count, dtype: int64
======= PRZYGOTOWANIE DANYCH DO EKSPERYMENTÓW =======
Przykładowe wartości w kolumnach genów: ['MUTATED' 'NOT_MUTATED' 'NOT_MUTATED' 'NOT_MUTATED' 'NOT_MUTATED']
Wybrana zmienna docelowa: Primary_Diagnosis
Unikalne wartości w kolumnie 'Primary_Diagnosis': ['Oligodendroglioma, NOS' 'Mixed glioma' 'Astrocytoma, NOS'
'Astrocytoma, anaplastic' 'Oligodendroglioma, anaplastic' 'Glioblastoma']
Liczba próbek dla każdej klasy:
Primary_Diagnosis
Glioblastoma 360
Astrocytoma, anaplastic 129
Mixed glioma 128
Oligodendroglioma, NOS 108
Oligodendroglioma, anaplastic 75
Astrocytoma, NOS 58
Name: count, dtype: int64
Średnia liczba mutacji na przypadek: 2.29
Mediana liczby mutacji: 2.00
Min/Max liczby mutacji: 0/17
======= EKSPERYMENT 1: WPŁYW ZŁOŻONOŚCI DANYCH =======
Poziomy złożoności danych:
Low Complexity: 250 przypadków
Średnia liczba mutacji: 0.72
Medium Complexity: 230 przypadków
Średnia liczba mutacji: 2.00
High Complexity: 378 przypadków
Średnia liczba mutacji: 3.50
Testowanie poziomu złożoności: Low Complexity
Aktywne mapy cech: ['Amplitude_l2_C1', 'Amplitude_l1_C1', 'Amplitude_min-max_C1']
Testowanie mapy cech: Amplitude_l2_C1
Dokładność: 0.7600
Testowanie mapy cech: Amplitude_l1_C1
Dokładność: 0.7600
Testowanie mapy cech: Amplitude_min-max_C1
Dokładność: 0.7600
Linear SVM: 0.7600
RBF SVM: 0.7600
Best Quantum SVM: 0.7600 (Amplitude_l2_C1)
Testowanie poziomu złożoności: Medium Complexity
Aktywne mapy cech: ['Amplitude_l2_C1', 'Amplitude_l1_C1', 'Amplitude_min-max_C1']
Testowanie mapy cech: Amplitude_l2_C1
Dokładność: 0.6232
Testowanie mapy cech: Amplitude_l1_C1
Dokładność: 0.6232
Testowanie mapy cech: Amplitude_min-max_C1
Dokładność: 0.6232
Linear SVM: 0.5797
RBF SVM: 0.5942
Best Quantum SVM: 0.6232 (Amplitude_l2_C1)
Testowanie poziomu złożoności: High Complexity
Aktywne mapy cech: ['Amplitude_l2_C1', 'Amplitude_l1_C1', 'Amplitude_min-max_C1']
Testowanie mapy cech: Amplitude_l2_C1
Dokładność: 0.3333
Testowanie mapy cech: Amplitude_l1_C1
Dokładność: 0.3333
Testowanie mapy cech: Amplitude_min-max_C1
Dokładność: 0.3333
Linear SVM: 0.3509
RBF SVM: 0.3421
Best Quantum SVM: 0.3333 (Amplitude_l2_C1)
Czas wykonania eksperymentu złożoności: 32054.69 sekund
Wyniki zapisane do pliku: wyniki/eksperymenty_poboczne-1/wyniki_eksperymentu_zlozonosc.csv
======= EKSPERYMENT 2: PODZBIORY GENÓW =======
Liczba genów w każdym podzbiorze:
Wszystkie geny: 20 genów (dostępne: 20, brakujące: 0)
Geny często mutowane: 4 genów (dostępne: 4, brakujące: 0)
Geny średnio mutowane: 7 genów (dostępne: 7, brakujące: 0)
Geny rzadko mutowane: 8 genów (dostępne: 8, brakujące: 0)
Testing gene subset: Wszystkie geny (n=all)
Testing ZZ1, C=10.0
Accuracy: 0.5388
Testing ZZ2, C=0.1
Accuracy: 0.4690
Testing Pauli1, C=10.0
Accuracy: 0.5349
Linear SVM: 0.5426
RBF SVM: 0.5349
Best Quantum SVM: 0.5388 (ZZ1_C10)
Testing gene subset: Geny często mutowane (n=4)
Testing ZZ1, C=10.0
Accuracy: 0.5426
Testing ZZ2, C=0.1
Accuracy: 0.5426
Testing Pauli1, C=10.0
Accuracy: 0.5194
Linear SVM: 0.5426
RBF SVM: 0.5543
Best Quantum SVM: 0.5426 (ZZ1_C10)
Testing gene subset: Geny średnio mutowane (n=7)
Testing ZZ1, C=10.0
Accuracy: 0.4341
Testing ZZ2, C=0.1
Accuracy: 0.4612
Testing Pauli1, C=10.0
Accuracy: 0.3992
Linear SVM: 0.4651
RBF SVM: 0.4690
Best Quantum SVM: 0.4612 (ZZ2_C01)
Testing gene subset: Geny rzadko mutowane (n=8)
Testing ZZ1, C=10.0
Accuracy: 0.4264
Testing ZZ2, C=0.1
Accuracy: 0.4225
Testing Pauli1, C=10.0
Accuracy: 0.4264
Linear SVM: 0.4225
RBF SVM: 0.4341
Best Quantum SVM: 0.4264 (ZZ1_C10)
Czas wykonania eksperymentu podzbiorów genów: 96842.45 sekund
Wyniki zapisane do pliku: wyniki/eksperymenty_poboczne-1/wyniki_eksperymentu_geny.csv
======= EKSPERYMENT 3: MAPOWANIA CECH =======
Aktywne mapy cech: ['Amplitude_l2_C1', 'Amplitude_l1_C1', 'Amplitude_min-max_C1']
Dokładność klasycznego SVM (RBF): 0.5504
Testowanie mapowania: Amplitude_l2_C1
Dokładność: 0.5349
Właściwości macierzy jądra: śr=0.069, std=0.250, min=-0.000, max=1.002
Testowanie mapowania: Amplitude_l1_C1
Dokładność: 0.5426
Właściwości macierzy jądra: śr=0.043, std=0.197, min=-0.000, max=1.002
Testowanie mapowania: Amplitude_min-max_C1
Dokładność: 0.5388
Właściwości macierzy jądra: śr=0.061, std=0.236, min=-0.000, max=1.003
Najlepsze mapowanie kwantowe: Amplitude_l1_C1 (dokładność: 0.5426)
Różnica względem klasycznego SVM: -0.0078
Czas wykonania eksperymentu mapowania cech: 93077.23 sekund
Wyniki zapisane do pliku: wyniki/eksperymenty_poboczne-1/wyniki_eksperymentu_mapowania.csv
======= PODSUMOWANIE EKSPERYMENTÓW =======
Całkowity czas wykonania eksperymentów: 221974.37 sekund (3699.57 minut)
Wyniki eksperymentu złożoności danych:
linear_svm rbf_svm ... Amplitude_l1_C1 Amplitude_min-max_C1
Low Complexity 0.76 0.76 ... 0.76 0.76
Medium Complexity 0.57971 0.594203 ... 0.623188 0.623188
High Complexity 0.350877 0.342105 ... 0.333333 0.333333
[3 rows x 7 columns]
Wyniki eksperymentu podzbiorów genów:
linear_svm rbf_svm ... Pauli1_C10 sample_size
Wszystkie geny 0.542636 0.534884 ... 0.534884 20
Geny często mutowane 0.542636 0.554264 ... 0.51938 4
Geny średnio mutowane 0.465116 0.468992 ... 0.399225 7
Geny rzadko mutowane 0.422481 0.434109 ... 0.426357 8
[4 rows x 8 columns]
Wyniki eksperymentu mapowania cech:
accuracy
Amplitude_l2_C1 0.534884
Amplitude_l1_C1 0.542636
Amplitude_min-max_C1 0.538760
Wszystkie wyniki zostały zapisane w katalogu: wyniki/eksperymenty_poboczne-1