Categoria Discussão:BI/Exemplos
Falta incluir, ou talvez começar pelos exemplos clássicos. As principais fontes/curadorias talvez sejam w:en:Data_set#Classic_data_sets, haskell/datasets (parcial aqui), UCI (most popular) e talvez telecom-paristech/igr204/datasets.
Critérios:
- Datasets classificados minimamente, quanto à noção estatística de amostra.
- Exemplos pequenos e documentados na Wikipedia. Ex. conjunto de dados da flor-de-lis (coments) e w:en:Anscombe's_quartet
- Exemplos classicos de uma disciplina (ex. Botanica) também documentados na wiki, mas externos. Exemplo: Vinhos.
- Exemplos didaticos padronizados...
- Outros: ex. https://github.com/plotly/datasets ou https://github.com/datasets ou https://www.europeandataportal.eu/
Outras fontes de "clássicos" para conferir se tem algo interessante: gaussianprocess, skymind, roweis,
Bigdata
editarExemplos de bigdata:
- Clássicos e invariantes: https://snap.stanford.edu/data/soc-pokec.html
- Clássicos e atualizados: IBGE
- Atualizados: OSM planet do Brasil
Cuidados com bigdata, quando o teste deixa de ser "apenas teste" ou os dados são usados para calibrar modelos estatísticos. O caso clássico são os bancos de dados (bigdata datasets) de reconhecimento facial. Ver https://www.ajlunited.org/