Parâmetros de pesquisa disponíveis

A página abaixo lista os parâmetros configuráveis nos arquivos YAML:

Parâmetros da DAG

  • id: Nome identificador da DAG a ser gerada.
  • description: Descrição da DAG de pesquisa.
  • doc_md: Documentação em markdown da DAG para uma descrição mais completa.
  • schedule: Agendamento da periodicidade de execução da DAG. Padrão cron (0 8 * * MON-FRI)
  • dataset: Agendamento da DAG baseado na atualização de um Dataset do Airflow. Em conjunto com o schedule a execução é condicionada ao schedule e dataset.
  • tags: Tags para categorizar a DAG.
  • owner: Responsável pela DAG.
  • search: Pode ser uma ou uma lista de pesquisas.
  • date: Intervalo de data para busca. Valores: DIA, SEMANA, MES, ANO. Default: DIA
  • department: Lista de unidades a serem filtradas na busca. O nome deve ser idêntico ao da publicação.
  • dou_sections: Lista de seções do DOU onde a busca deverá ser realizada. Valores aceitos: SECAO_1, SECAO_2, SECAO_3, EDICAO_EXTRA, EDICAO_SUPLEMENTAR, TODOS.
  • field: Campos dos quais os termos devem ser pesquisados. Valores: TUDO, TITULO, CONTEUDO. Default: TUDO
  • force_rematch: Indica que a busca deve ser forçada, mesmo que já tenha sido feita anteriormente. Valores: True ou False.
  • full_text: Define se no relatório será exibido o texto completo, ao invés de um resumo. Valores: True ou False. Default: False. (Funcionalidade disponível apenas no INLABS)
  • use_summary: Define se no relatório será exibido a ementa, se existir. Valores: True ou False. Default: False. (Funcionalidade disponível apenas no INLABS)
  • ignore_signature_match: Ignora a correspondência de assinatura ao realizar a busca. Valores: True ou False. Default: False.
  • is_exact_search: Busca somente o termo exato. Valores: True ou False. Default: True.
  • pubtype: Lista de tipos de publicações a serem filtradas na busca. Valores: Lista de tipos de publicações.
  • sources: Fontes de pesquisa dos diários oficiais. Pode ser uma ou uma lista. Opções disponíveis: DOU, QD, INLABS.
  • terms: Lista de termos a serem buscados. Para o INLABS podem ser utilizados operadores avançados de busca.
  • territory_id: Lista de identificadores do id do município. Necessário para buscar no Querido Diário.

Parâmetros do Relatório (Report)

  • attach_csv: Anexar no email o resultado da pesquisa em CSV.
  • discord_webhook: URL de Webhook para integração com o Discord.
  • emails: Lista de emails dos destinatários.
  • footer_text: Texto em HTML do rodapé do relatório.
  • header_text: Texto em HTML de cabeçalho do relatório.
  • hide_filters: Omite no relatório os filtros de pesquisa.
  • no_results_found_text: Texto padrão para quando não há resultados encontrados. Default: Nenhum dos termos pesquisados foi encontrado nesta consulta.
  • report: Parâmetros de notificação de relatório.
  • skip_null: Dispensa o envio de email quando não há resultados encontrados em todas as pesquisas. Valores: True ou False. Default: True.
  • slack_webhook: URL de Webhook para integração com o Slack.
  • subject: Texto de assunto do email.