Collezione di dataset 'Functions'

Collezione di dataset sintetici generati applicando funzioni continue e limitate a un sottoinsieme chiuso del dominio; ci sono dataset fatti con funzioni scalari e vettoriali e/o di una o più variabili. I dataset sono in formato .csv con header (ogni colonna dell'header corrisponde al nome di una variabile) e in alcuni casi vi sono anche file in formato .arff (per Weka); ci sono file di training/learning e file di test: i primi sono più grandi dei secondi e la maggior parte dei dati contenuti nei file di test non sono presenti nei file di training/learning.

Dataset di funzioni reali continue e limitate di una variabile:   $y=f(x) : {\rm I\!R} \to {\rm I\!R}$

ID Formula Dominio Info Train Link Train Info Test Link Test
RtoR/001 $y=\frac{1}{2} x^3 - 2 x^2 - 3 x - 1$ $[-10, 10]$ Istanze: 2001, discretizzazione: 0.01 .csv   .arff Istanze: 446, discretizzazione: 0.045 .csv   .arff
RtoR/002 $y=\sin x$ $[-2 \pi, 2 \pi]$ Istanze: 1257, discretizzazione: 0.01 .csv   .arff Istanze: 280, discretizzazione: 0.045 .csv   .arff
RtoR/003 $y=e^x$ $[-5, 5]$ Istanze: 1001, discretizzazione: 0.01 .csv   .arff Istanze: 223, discretizzazione: 0.045 .csv   .arff
RtoR/004 $y=\sqrt{|x|}$ $[-5, 5]$ Istanze: 1001, discretizzazione: 0.01 .csv   .arff Istanze: 223, discretizzazione: 0.045 .csv   .arff
RtoR/005 $y=\ln{|x|}$ $[-5, 5]$ Istanze: 1001, discretizzazione: 0.01 .csv   .arff Istanze: 223, discretizzazione: 0.045 .csv   .arff
RtoR/006 $y=\arctan{|x|}$ $[-5, 5]$ Istanze: 1001, discretizzazione: 0.01 .csv   .arff Istanze: 223, discretizzazione: 0.045 .csv   .arff
RtoR/007 $y=e^{\sin x}$ $[-2 \pi, 2 \pi]$ Istanze: 1257, discretizzazione: 0.01 .csv   .arff Istanze: 280, discretizzazione: 0.045 .csv   .arff
RtoR/008 $y=\tanh x$ $[-5, 5]$ Istanze: 1001, discretizzazione: 0.01 .csv   .arff Istanze: 223, discretizzazione: 0.045 .csv   .arff
RtoR/009 $y=\frac{\sin 2x}{e^\frac{x}{5}}$ $[-20, 20]$ Istanze: 4000, discretizzazione: 0.01 .csv   .arff Istanze: 889, discretizzazione: 0.045 .csv   .arff

Download dei dataset

I dataset sono disponibili su GitHub.
Questo materiale è distribuito su licenza MIT; sentiti libero di usare, condividere, "forkare" e adattare tale materiale come credi.
Sentiti anche libero di pubblicare pull-request e bug-report su questo repository di GitHub oppure di contattarmi sui miei canali social disponibili nell'angolo in alto a destra di questa pagina.