Sessão 2 · UC00248

Hardware, software
e Machine Learning

4 horas · 9h–13h · O que está por baixo da IA

→ clica para avançar

O que fazemos hoje

💾
Hardware da IA — GPU, TPU e porque importam
📊
Dados — tipos, qualidade e o que define um bom dataset
🤖
Machine Learning — supervisionado, não-supervisionado, reforço
💬
LLMs e IA Generativa — como funcionam ChatGPT, Claude, Gemini
✍️
Exercícios 1 e 2 — ML na minha organização + auditoria de dados

O hardware que torna tudo possível

CPU — processador clássico

Óptimo para tarefas sequenciais e complexas. O cérebro do computador para operações gerais.

Cores: 8–64 · Rápido mas sequencial

GPU — processador gráfico

Executa milhares de operações em paralelo. Criado para jogos, adoptado pela IA.

Cores: 1.000–10.000+ · Paralelo massivo

TPU — Tensor Processing Unit (Google)

Chip desenhado especificamente para treinar modelos de IA. 10–100x mais eficiente que GPU para ML. É o que corre o Gemini.

Analogia: CPU = cozinheiro de alta cozinha. GPU = linha de montagem. TPU = fábrica especializada em IA.

O que são dados para a IA

Dados estruturados

Tabelas, bases de dados, CSV. Cada linha é um registo, cada coluna é um atributo.

Ex: vendas, clientes, transacções

Dados não estruturados

Texto, imagens, áudio, vídeo. A maioria dos dados do mundo é deste tipo.

Ex: emails, fotos, contratos

Dados semi-estruturados

JSON, XML, logs. Têm alguma organização mas não são tabelas rígidas.

Ex: dados de API, logs de sistema

A qualidade dos dados define a qualidade da IA. Garbage in, garbage out — dados maus produzem modelos maus, independentemente do algoritmo.

Os 3 tipos de Machine Learning

🏷️
Supervisionado — aprende com exemplos rotulados (input → output correcto). O mais comum em empresas.
Ex: classificar spam, prever churn, detectar fraude
🔍
Não-supervisionado — encontra padrões sem rótulos. Agrupa dados semelhantes.
Ex: segmentar clientes, detectar anomalias
🎮
Por reforço — aprende por tentativa e erro com recompensas. Optimiza para um objectivo a longo prazo.
Ex: robots, sistemas de recomendação, jogos

O pipeline do ML: Dados → Treino do modelo → Validação → Inferência (uso em produção)

Como funciona um LLM

📚
Treino massivo — lê biliões de textos da internet, livros, código
🔢
Aprende a prever — qual a próxima palavra mais provável em cada contexto
🧩
Emergência — ao aprender a prever texto, emerge a capacidade de raciocinar
💬
RLHF — humanos avaliam as respostas para tornar o modelo mais útil e seguro

Os grandes players

ChatGPT — OpenAI · GPT-4o · maior ecossistema

Claude — Anthropic · 200k contexto · foco em segurança

Gemini — Google · integrado no Workspace

Copilot — Microsoft · integrado no Office

Exercício 1 · Peça 2a · 20 min · Individual

Que problema na minha organização poderia resolver com ML?

1Descreve o problema em 1–2 frases (ex: "classificar reclamações por urgência")
2Que dados históricos existem ou poderiam ser recolhidos?
3Qual seria o output do modelo? (classificação, valor previsto, recomendação)
4Que riscos identifies? (viés, privacidade, erros com consequências graves)

📋 Peça 2a do Projecto Final · Tarefa Moodle — entrega até à Sessão 3

Exercício 2 · Peça 2b · 30 min · Em grupo

Auditoria de dados da minha organização

1Listem 5 tipos de dados que a organização recolhe (ex: dados de vendas, registos de clientes)
2Para cada um: estão organizados e acessíveis? Ou em papel, email, sistemas desconectados?
3Que decisão de negócio poderia ser melhorada com estes dados analisados por IA?
4Que riscos de privacidade ou viés identificam?

📋 Peça 2b do Projecto Final · Tarefa Moodle — entrega até à Sessão 3

Cloud — IA como serviço

☁️
Não precisas de hardware próprio — acedes à capacidade de computação via internet.
💳
Pay-as-you-go — pagas apenas pelo que usas. Sem investimento inicial em servidores.
🚀
Acesso imediato a modelos de última geração sem gerir infra-estrutura.

Os 3 grandes fornecedores

AWS (Amazon) — SageMaker, Bedrock

Azure (Microsoft) — Azure AI, OpenAI integrado

GCP (Google) — Vertex AI, Gemini

Atenção: latência, custo variável com escala e dependência do fornecedor

O ecossistema de software IA

Camada de dados

Bases de dados, data lakes, pipelines de ingestão e transformação

PostgreSQL, Snowflake, dbt

Camada de modelos

Frameworks para construir e treinar modelos de IA

TensorFlow, PyTorch, scikit-learn

Camada de aplicação

Ferramentas prontas a usar via API ou interface

ChatGPT, Claude, Copilot, Gemini

Camada de integração

Liga as ferramentas IA aos teus processos existentes — sem código ou com pouco código.

Zapier, Make (ex-Integromat), n8n, Power Automate

Quando NÃO usar Machine Learning

⚠️
Dados insuficientes — menos de ~100 exemplos rotulados raramente produzem um modelo útil. Recolhe mais dados primeiro.
🔁
Regras explícitas simples — se um if-else resolve o problema, não precisas de ML. A solução mais simples é a melhor.
⚖️
Decisões legais de alto risco sem DPIA — despedimentos, crédito, diagnóstico clínico exigem explicabilidade total que muitos modelos não oferecem.
💥
Custo de erro catastrófico — se um erro causa danos irreversíveis sem supervisão humana, a margem de segurança é insuficiente.
📉
ROI negativo — se a solução manual demora 2h/semana e construir o modelo leva 3 meses, não vale a pena.

Resumo da Sessão 2

💾

GPU e TPU são o combustível da IA — processamento paralelo massivo.

📊

Qualidade dos dados define a qualidade do modelo. Garbage in, garbage out.

🏷️

ML supervisionado é o mais útil para empresas: aprende com exemplos rotulados.

💬

LLMs aprendem a prever texto — e emergem capacidades surpreendentes.

🎯

Próxima sessão: sessão pivô — defines o teu caso de uso para o projecto final.

📋

Peças 2a e 2b do projecto — entregar antes da Sessão 3.

Hardware, softwaree Machine Learning

O que fazemos hoje

O hardware que torna tudo possível

CPU — processador clássico

GPU — processador gráfico

TPU — Tensor Processing Unit (Google)

O que são dados para a IA

Dados estruturados

Dados não estruturados

Dados semi-estruturados

Os 3 tipos de Machine Learning

Como funciona um LLM

Os grandes players

Que problema na minha organização poderia resolver com ML?

Auditoria de dados da minha organização

Cloud — IA como serviço

Os 3 grandes fornecedores

O ecossistema de software IA

Camada de dados

Camada de modelos

Camada de aplicação

Camada de integração

Quando NÃO usar Machine Learning

Resumo da Sessão 2

Hardware, software
e Machine Learning