From 584a4d07d4e47a88039b670438aa7f2582b4b583 Mon Sep 17 00:00:00 2001
From: Alejandro Moreo <alejandro.moreo@isti.cnr.it>
Date: Mon, 16 Sep 2024 15:07:19 +0200
Subject: [PATCH 1/2] removing pylint

---
 .github/workflows/pylint.yml | 23 -----------------------
 1 file changed, 23 deletions(-)
 delete mode 100644 .github/workflows/pylint.yml

diff --git a/.github/workflows/pylint.yml b/.github/workflows/pylint.yml
deleted file mode 100644
index 383e65c..0000000
--- a/.github/workflows/pylint.yml
+++ /dev/null
@@ -1,23 +0,0 @@
-name: Pylint
-
-on: [push]
-
-jobs:
-  build:
-    runs-on: ubuntu-latest
-    strategy:
-      matrix:
-        python-version: ["3.8", "3.9", "3.10"]
-    steps:
-    - uses: actions/checkout@v3
-    - name: Set up Python ${{ matrix.python-version }}
-      uses: actions/setup-python@v3
-      with:
-        python-version: ${{ matrix.python-version }}
-    - name: Install dependencies
-      run: |
-        python -m pip install --upgrade pip
-        pip install pylint
-    - name: Analysing the code with pylint
-      run: |
-        pylint $(git ls-files '*.py')

From cea96e87c6f08f5b5bc7173717f9dd84e142a30e Mon Sep 17 00:00:00 2001
From: Alejandro Moreo <alejandro.moreo@isti.cnr.it>
Date: Mon, 16 Sep 2024 15:30:34 +0200
Subject: [PATCH 2/2] added path to sys.path in config

---
 KDEy/experiments.py | 108 ++++++++++++++++++++++++++++++++++++++++++++
 docs/source/conf.py |   5 ++
 2 files changed, 113 insertions(+)
 create mode 100644 KDEy/experiments.py

diff --git a/KDEy/experiments.py b/KDEy/experiments.py
new file mode 100644
index 0000000..fb279fc
--- /dev/null
+++ b/KDEy/experiments.py
@@ -0,0 +1,108 @@
+import numpy as np
+from sklearn.linear_model import LogisticRegression
+from os.path import join
+import quapy as qp
+from quapy.protocol import UPP
+from quapy.method.aggregative import KDEyML
+
+DEBUG = True
+
+qp.environ["SAMPLE_SIZE"] = 100 if DEBUG else 500
+val_repeats  = 100 if DEBUG else 500
+test_repeats = 100 if DEBUG else 500
+if DEBUG:
+    qp.environ["DEFAULT_CLS"] = LogisticRegression()
+
+test_results = {}
+val_choice = {}
+
+bandwidth_range = np.linspace(0.01, 0.20, 20)
+if DEBUG:
+    bandwidth_range = np.linspace(0.01, 0.20, 10)
+
+def datasets():
+    for dataset_name in qp.datasets.UCI_MULTICLASS_DATASETS[:4]:
+        dataset = qp.datasets.fetch_UCIMulticlassDataset(dataset_name)
+        if DEBUG:
+            dataset = dataset.reduce(random_state=0)
+        yield dataset
+
+
+def experiment_dataset(dataset):
+    train, test = dataset.train_test
+    test_gen = UPP(test, repeats=test_repeats)
+
+    # bandwidth chosen during model selection in validation
+    train_tr, train_va = train.split_stratified(random_state=0)
+    kdey = KDEyML(random_state=0)
+    modsel = qp.model_selection.GridSearchQ(
+        model=kdey,
+        param_grid={'bandwidth': bandwidth_range},
+        protocol=UPP(train_va, repeats=val_repeats),
+        refit=False,
+        n_jobs=-1
+    ).fit(train_tr)
+    chosen_bandwidth = modsel.best_params_['bandwidth']
+    modsel_choice = float(chosen_bandwidth)
+
+    # results in test
+    print(f"testing KDEy in {dataset.name}")
+    dataset_results = []
+    for b in bandwidth_range:
+        kdey = KDEyML(bandwidth=b, random_state=0)
+        kdey.fit(train)
+
+        mae = qp.evaluation.evaluate(kdey, protocol=test_gen, error_metric='mae', verbose=True)
+        print(f'bandwidth={b}: {mae:.5f}')
+        dataset_results.append((float(b), float(mae)))
+
+    return modsel_choice, dataset_results
+
+def plot_bandwidth(val_choice, test_results):
+    for dataset_name in val_choice.keys():
+        import matplotlib.pyplot as plt
+
+        bandwidths, results = zip(*test_results[dataset_name])
+
+        # Crear la gráfica
+        plt.figure(figsize=(8, 6))
+
+        # Graficar los puntos de datos
+        plt.plot(bandwidths, results, marker='o')
+
+        # Agregar la línea vertical en bandwidth_chosen
+        plt.axvline(x=val_choice[dataset_name], color='r', linestyle='--', label=f'Bandwidth elegido: {val_choice[dataset_name]}')
+
+        # Agregar etiquetas y título
+        plt.xlabel('Bandwidth')
+        plt.ylabel('Resultado')
+        plt.title('Gráfica de Bandwidth vs Resultado')
+
+        # Mostrar la leyenda
+        plt.legend()
+
+        # Mostrar la gráfica
+        plt.grid(True)
+        plt.show()
+
+
+for dataset in datasets():
+    if DEBUG:
+        result_path = f'./results/debug/{dataset.name}.pkl'
+    else:
+        result_path = f'./results/{dataset.name}.pkl'
+
+    modsel_choice, dataset_results = qp.util.pickled_resource(result_path, experiment_dataset, dataset)
+    val_choice[dataset.name] = modsel_choice
+    test_results[dataset.name] = dataset_results
+
+    print(f'Dataset = {dataset.name}')
+    print(modsel_choice)
+    print(dataset_results)
+
+plot_bandwidth(val_choice, test_results)
+
+
+
+
+
diff --git a/docs/source/conf.py b/docs/source/conf.py
index cfed1ac..689cc6e 100644
--- a/docs/source/conf.py
+++ b/docs/source/conf.py
@@ -11,9 +11,14 @@
 from os.path import join
 quapy_path = join(pathlib.Path(__file__).parents[2].resolve().as_posix(), 'quapy')
 wiki_path = join(pathlib.Path(__file__).parents[0].resolve().as_posix(), 'wiki')
+source_path = pathlib.Path(__file__).parents[2].resolve().as_posix()
 print(f'quapy path={quapy_path}')
+print(f'quapy source path={source_path}')
 sys.path.insert(0, quapy_path)
 sys.path.insert(0, wiki_path)
+sys.path.insert(0, source_path)
+
+print(sys.path)
 
 
 project = 'QuaPy: A Python-based open-source framework for quantification'