Collezione di dataset 'Functions'
Collezione di dataset sintetici generati applicando funzioni continue e limitate a un sottoinsieme chiuso del dominio; ci sono dataset fatti con funzioni scalari e vettoriali e/o di una o più variabili. I dataset sono in formato .csv con header (ogni colonna dell'header corrisponde al nome di una variabile) e in alcuni casi vi sono anche file in formato .arff (per Weka); ci sono file di training/learning e file di test: i primi sono più grandi dei secondi e la maggior parte dei dati contenuti nei file di test non sono presenti nei file di training/learning.
Dataset di funzioni reali continue e limitate di una variabile: $y=f(x) : {\rm I\!R} \to {\rm I\!R}$
ID | Formula | Dominio | Info Train | Link Train | Info Test | Link Test |
---|---|---|---|---|---|---|
RtoR/001 | $y=\frac{1}{2} x^3 - 2 x^2 - 3 x - 1$ | $[-10, 10]$ | Istanze: 2001, discretizzazione: 0.01 | .csv .arff | Istanze: 446, discretizzazione: 0.045 | .csv .arff |
RtoR/002 | $y=\sin x$ | $[-2 \pi, 2 \pi]$ | Istanze: 1257, discretizzazione: 0.01 | .csv .arff | Istanze: 280, discretizzazione: 0.045 | .csv .arff |
RtoR/003 | $y=e^x$ | $[-5, 5]$ | Istanze: 1001, discretizzazione: 0.01 | .csv .arff | Istanze: 223, discretizzazione: 0.045 | .csv .arff |
RtoR/004 | $y=\sqrt{|x|}$ | $[-5, 5]$ | Istanze: 1001, discretizzazione: 0.01 | .csv .arff | Istanze: 223, discretizzazione: 0.045 | .csv .arff |
RtoR/005 | $y=\ln{|x|}$ | $[-5, 5]$ | Istanze: 1001, discretizzazione: 0.01 | .csv .arff | Istanze: 223, discretizzazione: 0.045 | .csv .arff |
RtoR/006 | $y=\arctan{|x|}$ | $[-5, 5]$ | Istanze: 1001, discretizzazione: 0.01 | .csv .arff | Istanze: 223, discretizzazione: 0.045 | .csv .arff |
RtoR/007 | $y=e^{\sin x}$ | $[-2 \pi, 2 \pi]$ | Istanze: 1257, discretizzazione: 0.01 | .csv .arff | Istanze: 280, discretizzazione: 0.045 | .csv .arff |
RtoR/008 | $y=\tanh x$ | $[-5, 5]$ | Istanze: 1001, discretizzazione: 0.01 | .csv .arff | Istanze: 223, discretizzazione: 0.045 | .csv .arff |
RtoR/009 | $y=\frac{\sin 2x}{e^\frac{x}{5}}$ | $[-20, 20]$ | Istanze: 4000, discretizzazione: 0.01 | .csv .arff | Istanze: 889, discretizzazione: 0.045 | .csv .arff |
Download dei dataset
I dataset sono disponibili su GitHub.
Questo materiale è distribuito su licenza MIT; sentiti libero di usare, condividere, "forkare" e adattare tale materiale come credi.
Sentiti anche libero di pubblicare pull-request e bug-report su questo repository di GitHub oppure di contattarmi sui miei canali social disponibili nell'angolo in alto a destra di questa pagina.