Início Rápido¶
Bem-vindo ao Global-Data-Finance! Este guia irá ajudá-lo a dar os primeiros passos com a biblioteca através de exemplos práticos e simples.
Pré-requisitos¶
Antes de começar, certifique-se de que você:
- ✅ Instalou o Global-Data-Finance (ver guia de instalação)
- ✅ Possui Python 3.12 ou superior
- ✅ Tem acesso à internet para downloads
Primeiro Exemplo: Documentos CVM¶
Vamos começar baixando documentos fundamentalistas da CVM (Comissão de Valores Mobiliários).
Código Básico¶
from globaldatafinance import FundamentalStocksDataCVM
# 1. Criar instância do cliente CVM
cvm = FundamentalStocksDataCVM()
# 2. Baixar documentos DFP (Demonstrações Financeiras Padronizadas)
cvm.download(
destination_path="/home/usuario/dados_cvm",
list_docs=["DFP"],
initial_year=2022,
last_year=2023
)
O que acontece?¶
- Criação do cliente: Inicializa o cliente CVM com configurações padrão
- Download: Baixa todos os arquivos DFP dos anos 2022 e 2023
- Resultado: Arquivos ZIP são salvos em
/home/usuario/dados_cvm
Saída Esperada¶
📥 Download de Documentos CVM
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
✓ Documentos baixados com sucesso!
📊 Resumo:
• Total de arquivos: 2
• Sucesso: 2
• Erros: 0
• Tempo decorrido: 45.3s
📁 Arquivos baixados:
✓ DFP - 2022
✓ DFP - 2023
Segundo Exemplo: Cotações Históricas B3¶
Agora vamos extrair cotações históricas da B3 (Bolsa de Valores do Brasil).
Código Básico¶
from globaldatafinance import HistoricalQuotesB3
# 1. Criar instância do cliente B3
b3 = HistoricalQuotesB3()
# 2. Extrair cotações de ações
result = b3.extract(
path_of_docs="/home/usuario/cotahist_zips",
assets_list=["ações"],
initial_year=2023,
destination_path="/home/usuario/cotacoes_extraidas"
)
O que acontece?¶
- Criação do cliente: Inicializa o cliente B3
- Extração: Processa arquivos COTAHIST ZIP e extrai dados de ações
- Conversão: Converte para formato Parquet otimizado
- Resultado: Arquivo
.parquetcom todas as cotações
Saída Esperada¶
📊 Extração de Cotações B3
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
✓ Extração concluída com sucesso!
📈 Resumo:
• Arquivos processados: 2
• Total de registros: 836,978
• Classes de ativos: ações
• Modo de processamento: fast
• Tempo decorrido: 77.9s
💾 Arquivo gerado:
/home/usuario/cotacoes_extraidas/cotahist_extracted.parquet
Explorando Dados Disponíveis¶
Antes de baixar ou extrair dados, você pode descobrir o que está disponível.
Descobrir Documentos CVM¶
from globaldatafinance import FundamentalStocksDataCVM
cvm = FundamentalStocksDataCVM()
# Listar todos os tipos de documentos disponíveis
docs = cvm.get_available_docs()
for code, description in docs.items():
print(f"{code}: {description}")
# Verificar anos disponíveis
years = cvm.get_available_years()
print(f"\nDados disponíveis de {years['General Document Years']} até {years['Current Year']}")
Saída:
DFP: Demonstração Financeira Padronizada
ITR: Informação Trimestral
FRE: Formulário de Referência
FCA: Formulário Cadastral
...
Dados disponíveis de 2010 até o ano atual
Descobrir Classes de Ativos B3¶
from globaldatafinance import HistoricalQuotesB3
b3 = HistoricalQuotesB3()
# Listar classes de ativos disponíveis
assets = b3.get_available_assets()
print("Classes de ativos disponíveis:")
for asset in assets:
print(f" • {asset}")
# Verificar intervalo de anos
years = b3.get_available_years()
print(f"\nDados disponíveis de {years['minimal_year']} até {years['current_year']}")
Saída:
Classes de ativos disponíveis:
• ações
• etf
• opções
• termo
• exercicio_opcoes
• forward
• leilao
Dados disponíveis de 1986 até o ano atual
Exemplo Completo: Pipeline de Dados¶
Aqui está um exemplo mais completo que combina download e extração:
from globaldatafinance import FundamentalStocksDataCVM, HistoricalQuotesB3
# === PARTE 1: Download de Documentos CVM ===
print("=" * 60)
print("ETAPA 1: Download de Documentos CVM")
print("=" * 60)
cvm = FundamentalStocksDataCVM()
cvm.download(
destination_path="/home/usuario/dados_financeiros/cvm",
list_docs=["DFP", "ITR"],
initial_year=2022,
last_year=2023,
automatic_extractor=True # Extrai automaticamente para Parquet
)
# === PARTE 2: Extração de Cotações B3 ===
print("\n" + "=" * 60)
print("ETAPA 2: Extração de Cotações B3")
print("=" * 60)
b3 = HistoricalQuotesB3()
result = b3.extract(
path_of_docs="/home/usuario/dados_financeiros/cotahist",
assets_list=["ações", "etf"],
initial_year=2022,
last_year=2023,
destination_path="/home/usuario/dados_financeiros/cotacoes",
output_filename="acoes_etf_2022_2023",
processing_mode="fast"
)
# === PARTE 3: Análise dos Resultados ===
print("\n" + "=" * 60)
print("RESUMO FINAL")
print("=" * 60)
if result['success']:
print(f"✓ Pipeline concluído com sucesso!")
print(f"✓ Total de registros extraídos: {result['total_records']:,}")
print(f"✓ Arquivo de cotações: {result['output_file']}")
else:
print(f"✗ Houve erros durante a extração")
if 'errors' in result:
for error in result['errors']:
print(f" • {error}")
Trabalhando com os Dados Extraídos¶
Após extrair os dados, você pode analisá-los com Pandas ou Polars:
Com Pandas¶
import pandas as pd
# Ler arquivo Parquet gerado
df = pd.read_parquet("/home/usuario/cotacoes_extraidas/cotahist_extracted.parquet")
# Visualizar primeiras linhas
print(df.head())
# Informações sobre o dataset
print(f"\nTotal de registros: {len(df):,}")
print(f"Colunas: {list(df.columns)}")
print(f"Período: {df['data'].min()} a {df['data'].max()}")
Com Polars (Mais Rápido)¶
import polars as pl
# Ler arquivo Parquet
df = pl.read_parquet("/home/usuario/cotacoes_extraidas/cotahist_extracted.parquet")
# Análise rápida
print(df.head())
print(f"\nShape: {df.shape}")
print(f"Memória: {df.estimated_size('mb'):.2f} MB")
Dicas para Iniciantes¶
Comece Pequeno
Ao testar pela primeira vez, use intervalos de anos pequenos (ex: 1-2 anos) para entender o comportamento da biblioteca antes de fazer downloads grandes.
Use Modo Fast
Para extração de cotações B3, o modo "fast" é recomendado na maioria dos casos, oferecendo melhor performance.
Verifique Espaço em Disco
Documentos CVM e cotações históricas podem ocupar bastante espaço. Certifique-se de ter espaço suficiente antes de baixar muitos anos.
Próximos Passos¶
Agora que você conhece o básico, explore:
- 📄 Documentos CVM - Guia completo da API CVM
- 📈 Cotações B3 - Guia completo da API B3
- 💻 Exemplos Práticos - Casos de uso avançados
- ❓ FAQ - Perguntas frequentes
Parabéns!
Você completou o guia de início rápido! Agora você está pronto para explorar todo o potencial do Global-Data-Finance. 🚀