UC00248 · Sessão 2
Sessão 2 · UC00248

Hardware, software
e Machine Learning

4 horas · 9h–13h · O que está por baixo da IA

→ clica para avançar

O que fazemos hoje

O hardware que torna tudo possível

CPU — processador clássico

Óptimo para tarefas sequenciais e complexas. O cérebro do computador para operações gerais.

Cores: 8–64 · Rápido mas sequencial

GPU — processador gráfico

Executa milhares de operações em paralelo. Criado para jogos, adoptado pela IA.

Cores: 1.000–10.000+ · Paralelo massivo

TPU — Tensor Processing Unit (Google)

Chip desenhado especificamente para treinar modelos de IA. 10–100x mais eficiente que GPU para ML. É o que corre o Gemini.

Analogia: CPU = cozinheiro de alta cozinha. GPU = linha de montagem. TPU = fábrica especializada em IA.

O que são dados para a IA

Dados estruturados

Tabelas, bases de dados, CSV. Cada linha é um registo, cada coluna é um atributo.

Ex: vendas, clientes, transacções

Dados não estruturados

Texto, imagens, áudio, vídeo. A maioria dos dados do mundo é deste tipo.

Ex: emails, fotos, contratos

Dados semi-estruturados

JSON, XML, logs. Têm alguma organização mas não são tabelas rígidas.

Ex: dados de API, logs de sistema

A qualidade dos dados define a qualidade da IA. Garbage in, garbage out — dados maus produzem modelos maus, independentemente do algoritmo.

Os 3 tipos de Machine Learning

O pipeline do ML: Dados → Treino do modelo → Validação → Inferência (uso em produção)

Como funciona um LLM

  • 📚
    Treino massivo — lê biliões de textos da internet, livros, código
  • 🔢
    Aprende a prever — qual a próxima palavra mais provável em cada contexto
  • 🧩
    Emergência — ao aprender a prever texto, emerge a capacidade de raciocinar
  • 💬
    RLHF — humanos avaliam as respostas para tornar o modelo mais útil e seguro

Os grandes players

ChatGPT — OpenAI · GPT-4o · maior ecossistema

Claude — Anthropic · 200k contexto · foco em segurança

Gemini — Google · integrado no Workspace

Copilot — Microsoft · integrado no Office

Exercício 1 · Peça 2a · 20 min · Individual

Que problema na minha organização poderia resolver com ML?

  1. 1Descreve o problema em 1–2 frases (ex: "classificar reclamações por urgência")
  2. 2Que dados históricos existem ou poderiam ser recolhidos?
  3. 3Qual seria o output do modelo? (classificação, valor previsto, recomendação)
  4. 4Que riscos identifies? (viés, privacidade, erros com consequências graves)

📋 Peça 2a do Projecto Final · Tarefa Moodle — entrega até à Sessão 3

Exercício 2 · Peça 2b · 30 min · Em grupo

Auditoria de dados da minha organização

  1. 1Listem 5 tipos de dados que a organização recolhe (ex: dados de vendas, registos de clientes)
  2. 2Para cada um: estão organizados e acessíveis? Ou em papel, email, sistemas desconectados?
  3. 3Que decisão de negócio poderia ser melhorada com estes dados analisados por IA?
  4. 4Que riscos de privacidade ou viés identificam?

📋 Peça 2b do Projecto Final · Tarefa Moodle — entrega até à Sessão 3

Cloud — IA como serviço

  • ☁️
    Não precisas de hardware próprio — acedes à capacidade de computação via internet.
  • 💳
    Pay-as-you-go — pagas apenas pelo que usas. Sem investimento inicial em servidores.
  • 🚀
    Acesso imediato a modelos de última geração sem gerir infra-estrutura.

Os 3 grandes fornecedores

AWS (Amazon) — SageMaker, Bedrock

Azure (Microsoft) — Azure AI, OpenAI integrado

GCP (Google) — Vertex AI, Gemini

Atenção: latência, custo variável com escala e dependência do fornecedor

O ecossistema de software IA

Camada de dados

Bases de dados, data lakes, pipelines de ingestão e transformação

PostgreSQL, Snowflake, dbt

Camada de modelos

Frameworks para construir e treinar modelos de IA

TensorFlow, PyTorch, scikit-learn

Camada de aplicação

Ferramentas prontas a usar via API ou interface

ChatGPT, Claude, Copilot, Gemini

Camada de integração

Liga as ferramentas IA aos teus processos existentes — sem código ou com pouco código.

Zapier, Make (ex-Integromat), n8n, Power Automate

Quando NÃO usar Machine Learning

Resumo da Sessão 2

💾

GPU e TPU são o combustível da IA — processamento paralelo massivo.

📊

Qualidade dos dados define a qualidade do modelo. Garbage in, garbage out.

🏷️

ML supervisionado é o mais útil para empresas: aprende com exemplos rotulados.

💬

LLMs aprendem a prever texto — e emergem capacidades surpreendentes.

🎯

Próxima sessão: sessão pivô — defines o teu caso de uso para o projecto final.

📋

Peças 2a e 2b do projecto — entregar antes da Sessão 3.