Observatório de dados/Conjuntos

O que sabemos sobre Teoria dos Conjuntos? No Brasil, até os anos 1990 o tema fazia parte do curriculo obrigatório nas escolas de Ensino Fundamental... Deixou de ser, de modo que a formação e conhecimento dos jovens com relação aos conceitos e notações é bastante fragmentado e em níveis diversos.

O conjunto é o "cercadinho", as coisas dentro são os seus elementos.
Tutorial para a introdução de conceitos e convenções adotadas no Observatório de Dados, para se expressar formalmente conjuntos.

Problemas e motivações

editar

A seguir uma breve introdução sobre os problemas que justificam o conhecimento da Teoria dos Conjuntos no contexto da Estatística e dos Dados Abertos.

Nomes e coisas sem nome

editar
 
Se não sabemos o nome, apontamos com o dedo.

O que são nomes?

Todas as coisas a nossa volta possuem um nome, alguém as "batizou" e justamente por isso somos capazes de falar delas... Esse alguém é a tradição e o consenso na comunidade de falantes de uma língua.

Quando criança, mesmo dominando a fala, ainda não conseguimos “falar de todas as coisas”, pois não sabemos o nome de todas elas... Quando crianças, levamos um tempo aprendendo e memorizando, então apontamos o dedo para aquilo que ainda não sabemos o nome.

 
Diagrama ilustrando a interseção de dois conjuntos.

A criança não deixa de se comunicar quando ela aponta com o dedo (!). De fato, está usando no lugar do nome o próprio objeto... A rigor, usando um "apontador do objeto". Quando apontamos com o dedo estamos ancorando nomes a exemplos concretos. É o que os hiperlinks (ditos URLs) fazem na Web, apontam para o endereço do objeto, dispensando o seu nome.

Outro recurso, mental e linguístico, para "apontar com o dedo" de forma mais simbólica, são os operadores conjuntivos (operadores ⋃ e ⋂ da Teoria dos Conjuntos). Eles são usados com frequência no discurso científico para se referir a coisas complexas que não possuem nome. Exemplos em frases:

“foi obtido juntando tudo, as coisas Desse saco com Aquele”, pode ser expresso pelo operador união,  
“a parte da população M dos mamíferos comum à população O dos ovíparos”,  .
Podemos então dizer que o ornitorrinco está entre eles,  .

As expressões de conjuntos permitem designar as coisas sem a necessidade de batizá-las com um nome (!). Por isso podemos dizer que a álgebra de conjuntos é também uma ferramenta de linguagem do cientista.

Contextos

editar

Desde criança também aprendemos, aos poucos, que existem contextos e sinônimos: imagine que você é um nenê...

... na cozinha ao dizer “nenê qué água”, a água faz referência à bebida; na piscina água é referência à própria piscina. Em casa o nenê sabe que Mariana é a sua babá, mas na escola é o nome da diretora.
A cada um dos termos empregados pelo nenê, água e Mariana, existem sinônimos mais específicos, que o adulto, pelo contexto, traduz como “água do filtro”, “água da piscina”, “Mariana Eugênia da Silva” e “Maria Mariana Carvalhosa”.

O nome e eu seu contexto formam uma espécie de "âncora" em torno da coisa apontada, que nos permite referenciá-lo através da linguagem. A contexto dá flexibilidade ao uso de nomes, de duas formas:

  • em alguns casos o nome pode ser simplificado (abreviado). Por exemplo ao invés de usar o nome completo (ex. Mariana Eugênia da Silva), num contexto onde não haja tantas pessoas para causar confusão, usamos só o primeiro nome (Mariana Eugênia)... Ou mais simplificadamente, uma parte dele (Mariana) ou um apelido (Má).
  • em alguns casos o nome pode ser reutilizado para algo completamente diferente, porque o contexto estabelece uma referência para o tipo de objeto associado ao nome. No exemplo da palavra "água", que no contexto da cozinha nos faz pensar na água do filtro, enquanto no contexto da piscina nos faz pensar na própria piscina.

A reutilização de nomes, termos e símbolos, em Ciências, sobretudo em Matemática e Estatística, também pode depender de um processo mais "forçado" de contextualização, que é a definição explícita da notação. Exemplos:

  • na aula de matemática o professor pode dizer "seja x um número inteiro" num dia, e "seja x uma fração" no outro.
  • num livro de Estatística, como o Tavares2007, o autor pode se dar a liberdade de definir a letra c como símbolo de "amplitude do intervalo de classe", enquanto num livro de Física a letra c é padronizada como símbolo da "velocidade da luz no vácuo".

Tanto neste curso, como nos artigos da Wikipedia ou qualquer livro de assuntos técnicos ou científicos, precisamos estar sempre atentos ao contexto e à notação adotada pelo autor.

Nomes únicos e identificadores

editar

Vimos que, conforme o contexto (case e escola no exemplo acima) um mesmo nome, Mariana, pode designar pessoas diferentes. Quanto mais abrangente o contexto, maior a necessidade de um nome mais cumprido para não confundir com outros. Os matemáticos referem-se a esse contexto como "universo". Quando o universo é o Brasil, nem mesmo o nome completo é suficiente, e a solução prática é a adoção do código de CPF.

Tanto o primeiro nome, como o nome completo e o CPF são identificadores: eles permitem identificar o objeto dentro de um certo universo.

Na simbologia matemática, na Física, nos sistemas de software, etc. também existem símbolos que fazem papel de nomes próprios para certos contextos (por exemplo a letra G num texto sobre Astronomia designa a Constante gravitacional) mas perdem o significado quando fora de contexto. As variáveis também são contextuais, requerem um enunciado explicando o que significam... E os índices das variáveis (p. ex. em   a letra i é um índice), por fim, são identificadores locais.

Dar nomes, controlar termos e rotular índices e variáveis, tudo isso está relacionado com identificação e depende do contexto.

Abstraindo propriedades em catálogos

editar

A ficha catalográfica de um livro da biblioteca, e a ficha descritiva de uma planta na coleção do Jardim Botânico, são exemplos de ferramentas (as fichas) que permitem associar nomes a respectivos identificadores e a outras características do objeto descrito, ditas propriedades. Não precisamos saber tudo de uma planta ou de um livro, bastam algumas informações básicas, elas são suficientes e nos deixam seguros de que a partir delas nos lembraremos do objeto e não nos confundiremos com outros.

Registrar ou batizar com um nome, abstrair propriedades (ex. tamanho, número de folhas, etc.) e fornecer um identificador. São tarefas usuais e ficam registradas em simples tabelas (podendo ser armazenadas em planilhas ou bancos de dados relacionais)... A esse processo chamamos "modelagem relacional" (outro apelido para "tabela" é "relação"), e a designação genérica para os itens da tabela é entidade. Como a tabela cataloga várias entidades do mesmo tipo, dizemos que as tabelas modelam tipos de entidade (ex. livros). Esses conceitos são apresentados no livro ElmNav2011.

Trata-se de um recurso sofisticado para modelar conjuntos de qualquer tipo. E, novamente, sendo conjuntos, permite-se a definição de outros a partir de operações de união, intercessão... Figuras 8.1 (pag 247), 8.2 e 8.3 mostram a modelagem de classes, superclasses e herança... PS: para modelagens mais sofisticadas, Entidade-Relacionamento, ver Figura 7.9 pag 213 ilustrando construção de relacionamentos ...

Abstraindo a realidade através de modelos

editar

Outra importante aplicação para o uso dos conjuntos, é como ferramenta de modelagem... Um modelo matemático é uma representação ou interpretação simplificada da realidade, ou uma interpretação de um fragmento de um sistema, segundo uma estrutura de conceitos mentais ou experimentais.

Um modelo pode ajudar a explicar um sistema e a estudar os efeitos de diferentes componentes, e até fazer previsões sobre o seu comportamento.

Além de ilustrar a modelagem da escola, os seus subconjuntos de pessoas podem ser considerado um exemplo de classificação dos elementos da escola. A classificação de conjuntos em subconjuntos é outro tópico de grande importância na Estatística.

O livro ElmNav2011 no seu capítulo 8 mostra como os fatos e objetos do mundo real podem ser abstraídos e modelados como conjuntos através de diagramas.

Agrupamentos sistemáticos

editar
 
Um mosaico com células   coloridas.

Denominamos agrupamento dos elementos de um conjunto  , ao processo agregar todos os elementos, formando dois ou mais subconjuntos. A coleção de subconjuntos resultante é também chamada de partição do conjunto. Defini-se pelos subconjuntos   com as seguintes características,
 

 
 
      

A união dos grupos reproduz C, cada grupo tem pelo menos um elemento e os grupos são disjuntas entre si.

Ilustrando: se imaginarmos C como um conjunto retangular de pontos no plano, os grupos   formam um mosaico, cobrindo completamente a superfície retangular, sem buracos nem interseções.

Em Estatística é usual a agregação de observações individuais de uma variável em grupos  , de modo que uma distribuição de freqüência desses grupos sumariza as observações. Em Biologia, Biblioteconomia, e outras áreas, os agrupamentos   também são denominados classes, por serem válidos como esquema de classificação dos elementos de C.


Fundamentos matemáticos

editar

Um conjunto é considerado um dos conceitos mais básicos da matemática, sendo o elemento principal da Teoria dos Conjuntos. A partir das noções de conjuntos define-se o próprio conceito de número, e organizam-se os números também em conjuntos,  

A seguir uma rápida revisão dos conceitos e notações que usaremos neste curso.

Conjuntos e multiconjuntos

editar

A Teoria dos Conjuntos é ensinada nas escolas, mas a rigor os seus fundamentos são axiomatizados como teoria dos conjuntos de Zermelo-Fraenkel, prevendo também as chamadas operações conjuntivas (interseção, união e diferença) e algumas regras, tais como a não-repetição de elementos. Na Estatística, podemos manter o uso da mesma notação e rigor da conceituação, e sem lançar mão de notações ou conhecimentos mais profundos do que aquelas que adquirimos na escola.

Conjuntos são simbolizados por letras maiúsculas em itálicos, e eventualmente por nomes iniciados por maiúsculas. Elementos são simbolizados por letras minúsculas. A relação de pertinência do elemento no conjunto é dada pelo operador  .

A definição extensiva de conjuntos finitos pode ser realizada pela notação usual das chaves, por exemplo  . Também é valida a definição intensiva, que descreve propriedades dos elementos na forma  , onde a letra y é um "símbolo coringa", dito variável descritora dos elementos. O símbolo "∀" de "∀y", pode ser lido como "para todo y" e "|" como "tal que".


Basta dizer que   e   são conjuntos... pronto, estão batizados. Em seguida podemos falar dos seus elementos: por exemplo   expressa que o número 7 é um elemento do conjunto A;   que sp é elemento de Brasil. No último exemplo sp é um identificador (abreviação de "Estado de São Paulo"). As letras minúsculas também são empregadas nas variáveis que representam "elementos quaisquer" de um conjunto.

Simplesmente declarar que alguns elementos estão no conjunto pode ser esclarecedor, mas ainda não proporciona uma definição completa do conjunto. Os números primos 2, 3, 5, ..., assim listados, sugerem a sequência infinita OEIS:A000040, mas também podem ser outras, como a OEIS:A171057.

Só com a definição completa e não-ambígua podemos afirmar que conhecemos, fomos apresentados ao conjunto que leva aquele nome. Exemplo o conjunto A, da definição extensiva  , pode também receber definições intensivas, tais como

   
   

e pode ser lido como A é o conjunto dos elementos x tais que x é um dos 4 primeiros números primos. Repare que o grau de especificidade (ex. dizer apenas "números primos" os se referir a eles com o ID da sequência) vai depender do interlocutor compreender ou não um dado dialeto, e pelo contexto, ficar confuso ou não com uma denominação mais vaga.

Lembrar que um conjunto de pares ordenados pode ter mais de uma variável. Um conjunto de pontos geográfcos, por exemplo  .

Domínio de uma variável descritora de elementos é o conjunto dos valores válidos para a variável.

 
Na expressão  , onde x simboliza uma variável, o conjunto D está representando implicitamente o domínio.
Em alguns livros, como ElmNav2011, o domínio é explicitado pela função  .
Nas declarações de relações e funções  , dizemos que X é domínio de f, ou seja  , no lugar de referenciar a variável.

Qualquer conjunto pode ser adotado como domínio. Em geral, como lidamos com variáveis quantitativas, os domínios são intervalos numéricos.

Exemplo: conjunto T das temperaturas (em graus centígrados °C) válidas é um subconjunto dos Reais limitado pelas leis da Física, ou seja, podem ser negativas mas não abaixo do "zero absoluto", -273,15°C.   ou, dispensando a descrição semântica e limitando pela temperatura do sol,  .

Multiconjuntos e sequências de valores observados

São estruturas matemática ligeiramente mais sofisticadas que conjuntos, permitindo expressar elementos repetidos.

Um Multiconjunto é um conjunto usual munido do operador de multiplicidade do elemento, que informa quantas vezes um elemento se repete. Na representação extensiva adota-se a mesma simbologia (elementos entre chaves) que a dos conjuntos, porém permitindo a sua repetição.

Uma Sequência formalmente é uma relação do conjunto   dos Naturais com o conjunto (ex. D) dado, que fará o papel de domínio dos valores da sequência:  . Cada elemento da sequência pode ser identificado por seu índice,  

As observações podem se repetir, de forma que o conceito de conjunto não se presta a "guardar valores observados". Na Matemática as estruturas mais populares para se expressar observações são o multiconjunto e a sequência. O termo "multiconjunto" destaca a propriedade em que difere do conjunto:

  • O multiconjunto   contém apenas elementos   e  , cada um tendo multiplicidade 1.
  • No multiconjunto  ,   tem multiplicidade 2 e   multiplicidade 1.
  • No multiconjunto  , ambos elementos,   e  , tem multiplicidade 3.

Cardinalidade de um conjunto ou multiconjunto, é o número de elementos contidos nele.

A operação concreta que leva à cardinalidade é a contagem.
No caso de multiconjuntos contam-se os repetidos, de modo que a sua cardinalidade pode também ser obtida pela soma da multiplicidade de todos os seus elementos.

 
A função  , de um conjunto ou multiconjunto X, com valor representado por  , retorna a sua cardinalidade.

Em alguns livros é também utilizada a notação de "operador módulo",  .

Poderíamos usar cores ou símbolos diferentes para falar de conjuntos, multiconjuntos ou sequências, mas, infelizmente, não existem convenções ou tradições de uso para essas representações alternativas: é importante sempre estar atento (!) pois as três representações seguem praticamente a mesma notação que a de conjuntos. Na dúvida use (ou suponha) o conceito mais robusto, que é o de sequência.

Pares ordenados e produto de conjuntos

editar

...

Exercícios

editar

Sugestões de exercícios para conferir conhecimentos:

Ver também

editar