top 64 informatica interview questions with answers
Perguntas e respostas mais frequentes das entrevistas da Informatica:
Este artigo aborda as principais perguntas sobre Informatica MDM, PowerCenter, Qualidade de dados, Nuvem, ETL, Admin, Teste e Desenvolvedor.
No cenário atual, a INFORMATICA alcançou a marca de um produto mais exigente em todo o mundo. Seus produtos foram introduzidos recentemente, mas se tornaram populares em um curto período de tempo.
Ao longo dos anos, a INFORMATICA tem atuado como líder na área de tecnologia de Integração de Dados. Com base na arquitetura ETL (Extract, Transfer, Load), esta ferramenta de integração de dados possui vários produtos que se concentram no fornecimento de serviços para organizações governamentais, financeiras e seguradoras, saúde e vários outros negócios.
Bem, esse foi apenas o pano de fundo da INFORMATICA. Mas hoje, o campo de armazenamento de dados tem um crescimento tremendo e, portanto, muitas oportunidades de trabalho estão disponíveis no setor.
Melhores Perguntas e Respostas para Entrevistas da Informatica
A seguir, está uma lista das perguntas e respostas mais comuns da entrevista. Inclui cerca de 64 perguntas que, por sua vez, permitiriam que você aprimorasse seu conhecimento sobre os conceitos da Informatica de uma maneira mais fácil.
P # 1) O que é INFORMATICA? Por que precisamos disso?
Responda: INFORMATICA é uma empresa de desenvolvimento de software que oferece alguma solução de integração de dados para ETL, virtualização de dados, gerenciamento de dados mestre, qualidade de dados, réplica de dados, ultra messaging, etc.
Alguns dos produtos INFORMATICA populares são:
- IT PowerCenter
- INFORMATICA PowerConnect
- COMPUTING Power Mart
- INFORMATICA Power Exchange
- Análise de Energia INFORMATICA
- INFORMATICA Power Quality
Precisamos de INFORMATICA enquanto trabalhamos com sistemas de dados que contêm dados para realizar certas operações junto com um conjunto de regras. Ele facilita a limpeza da linha de operações e a modificação de dados de sistemas de dados estruturados e não estruturados.
P # 2) Qual é o formato dos objetos INFORMATICA em um repositório? Quais são os bancos de dados que ele pode conectar ao Windows?
Responda: Os objetos INFORMATICA podem ser escritos no formato XML.
A seguir está a lista de bancos de dados aos quais ele pode se conectar:
- servidor SQL
- Oráculo
- MS Access
- MS Excel
- DB2
- Sybase
- Teradata
P # 3) O que é INFORMATICA PowerCenter?
Responda: É uma ferramenta de integração de dados / ETL que é usada para conectar e recuperar dados de diferentes fontes e processamento de dados. O PowerCenter processa um grande volume de dados e oferece suporte à recuperação de dados de fontes ERP, como SAP, PeopleSoft, etc.
Você pode conectar o PowerCenter a sistemas de gerenciamento de banco de dados como SQL e Oracle para integrar dados ao terceiro sistema.
P # 4) Quais são as diferentes edições do INFORMATICA PowerCenter que estão disponíveis?
Resposta: As diferentes edições do INFORMATICA PowerCenter são:
- Edição Padrão
- Edição Avançada
- Edição Premium
A versão atual do PowerCenter disponível é v10 com um aumento de alto desempenho.
P # 5) Como você pode diferenciar entre PowerCenter e Power Map?
Resposta: Abaixo estão as diferenças entre o PowerCenter e o Power Map.
IT PowerCenter | Ciência da computação PowerMart | ||
---|---|---|---|
5858 | 4566 | 3550 | 23/01/2016 |
1 | Processa grande volume de dados | Processa baixo volume de dados | |
2 | Suporta repositórios globais e locais | Suporta apenas repositórios locais | |
3 - | Suporta recuperação de dados de ERP Fontes como SAP, PeopleSoft etc. | Não oferece suporte para recuperação de dados de fontes de ERP | |
Quatro. | Converte repositórios locais em globais | Não converta repositórios locais em globais |
Q # 6) Quais são os diferentes componentes do PowerCenter?
Resposta: Abaixo estão os 7 componentes importantes do PowerCenter:
- Serviço PowerCenter
- Clientes PowerCenter
- Repositório PowerCenter
- Domínio PowerCenter
- Serviço de Repositório
- Serviço de Integração
- PowerCenter Administration Console
- Hub de serviço da web
P # 7) Quais são os diferentes clientes do PowerCenter?
Resposta: Aqui está a lista de clientes PowerCenter:
- Designer do PowerCenter
- Monitor de fluxo de trabalho PowerCenter
- Gerenciador de fluxo de trabalho PowerCenter
- Gerenciador de repositório do PowerCenter
P # 8) O que é Repositório INFORMATICA do PowerCenter?
Responda: O Repositório do PowerCenter é um banco de dados relacional ou um banco de dados do sistema que contém metadados como,
- Definição da fonte
- Definição de alvo
- Registros de sessão e sessão
- Fluxo de Trabalho
- Conexão ODBC
- Mapeamento
Existem dois tipos de Repositórios:
- Repositórios Globais
- Repositórios Locais
O Repositório do PowerCenter é necessário para realizar Extração, Transformação e Carregamento (ETL) com base em metadados.
Q # 9) Como elaborar o nível de rastreamento?
Responda: O nível de rastreamento pode ser definido como a quantidade de informações que o servidor grava no arquivo de log. O nível de rastreamento é criado e configurado no nível de transformação ou no nível da sessão em ambos os níveis.
Abaixo estão os 4 tipos de nível de rastreamento:
- Nenhum
- Conciso
- Inicialização Detalhada
- Dados detalhados
P # 10) Como elaborar o serviço de integração do PowerCenter?
Responda: Os serviços de integração controlam o fluxo de trabalho e a execução dos processos do PowerCenter.
Existem três componentes dos serviços de integração de INFORMATICA, conforme mostrado na figura abaixo.
Processo do Serviço de Integração: É chamado de pmserver, o serviço de integração pode iniciar mais de um processo para monitorar o fluxo de trabalho.
Balanceamento de carga: O balanceamento de carga se refere à distribuição de toda a carga de trabalho entre vários nós da grade. Um balanceador de carga realiza diferentes tarefas que incluem comandos, sessões, etc.
Data Transformation Manager (DTM): O Data Transformation Manager permite realizar as seguintes transformações de dados:
- Ativo: Para alterar o número de linhas na saída.
- Passiva: Não é possível alterar o número de linhas na saída.
- Conectado: Link para a outra transformação.
- Desconectado: Sem link para outras transformações.
Q # 11) O que é PowerCenter no Grid?
Responda: INFORMATICA possui a característica de Grid Computing que pode ser utilizada para a maior escalabilidade de dados visando o desempenho. O recurso de grade é usado para balanceamento de carga e processamento paralelo.
Os domínios do PowerCenter contêm um conjunto de vários nós para configurar a carga de trabalho e depois executá-lo na grade.
PARA domínio é a base para uma administração de serviço eficiente servida pelo PowerCenter.
Nó é uma máquina física independente que é logicamente representada para executar o ambiente do PowerCenter.
P # 12) O que é Enterprise Data Warehousing?
Responda: Quando uma grande quantidade de dados é reunida em um único ponto de acesso, é chamado de Enterprise Data Warehousing. Esses dados podem ser reutilizados e analisados em intervalos regulares ou conforme a necessidade do requisito de tempo.
Considerado como o banco de dados central ou, digamos, um único ponto de acesso, o data warehouse empresarial oferece uma visão global completa e, portanto, auxilia no suporte à decisão.
Pode ser mais compreendido a partir dos seguintes pontos que definem suas características:
- Todas as informações comerciais importantes armazenadas neste banco de dados unificado podem ser acessadas de qualquer lugar da organização.
- Embora o tempo necessário seja maior, a análise periódica nesta única fonte sempre produz melhores resultados.
- A segurança e a integridade dos dados nunca são comprometidas, tornando-os acessíveis em toda a organização.
P # 13) Qual é a vantagem do particionamento de sessão?
Responda: Enquanto o serviço de integração está em execução no ambiente, o fluxo de trabalho é particionado para melhor desempenho. Essas partições são então usadas para realizar Extração, Transformação e Carregamento.
Q # 14) Como podemos criar um índice após a conclusão do processo de carregamento?
Responda: As tarefas de comando são usadas para criar um índice. Os scripts de tarefa de comando podem ser usados em uma sessão do fluxo de trabalho para criar um índice.
P # 15) O que são sessões?
Responda: Sessão é um conjunto de instruções usadas ao mover dados da origem para o destino. Podemos particionar a sessão para implementar várias sequências de sessões para melhorar o desempenho do servidor.
Depois de criar uma sessão, podemos usar o gerenciador de servidor ou o programa de linha de comando pmcmd para parar ou iniciar a sessão.
P # 16) Como podemos usar lotes?
Responda: Lotes são a coleção de sessões usadas para migrar os dados da origem para o destino em um servidor. Os lotes podem ter o maior número de sessões, mas causam mais tráfego de rede, enquanto menos sessões em um lote podem ser movidas rapidamente.
Q # 17) O que é mapeamento?
Responda: Mapeamento é uma coleção de origens e destinos que estão vinculados uns aos outros por meio de certos conjuntos de transformações, como Transformação de Expressão, Transformação de Classificador, Transformação de Agregador, Transformação de Roteador, etc.
Q # 18) O que é transformação?
Responda: A transformação pode ser definida como um conjunto de regras e instruções que devem ser aplicadas para definir o fluxo de dados e a carga de dados no destino.
Q # 19) O que é transformação de expressão?
Responda: É uma transformação de mapeamento usada para transformar dados em um registro por vez. A transformação da expressão pode ser passiva ou conectada. A expressão é usada para manipulação de dados e geração de saída usando declarações condicionais.
Q # 20) O que é a transformação da estratégia de atualização?
Responda: A estratégia de atualização na Informatica é usada para controlar os dados que passam por ela e marcá-los como INSERT, UPDATE, DELETE e REJECT. Podemos definir uma Lógica condicional na Transformação da Estratégia de Atualização para marcá-la.
Q # 21) O que é transformação de classificador?
é a chave de segurança igual à senha
Responda: A transformação de classificador é usada para classificar grandes volumes de dados por meio de várias portas. É muito provável que funcione como a cláusula ORDER BY no SQL. A transformação do classificador pode ser ativa, passiva ou conectada.
A transformação ativa passa pelo mapeamento e altera o número de linhas, enquanto a transformação Passiva passa pelo mapeamento, mas não altera o número de linhas.
A maioria das transformações INFORMATICA está conectada ao caminho de Dados.
P # 22) O que é transformação de roteador?
Responda: A transformação de roteador é usada para filtrar os dados de origem. Você pode usar a transformação de roteador para dividir uma única fonte de dados.
É muito parecida com a transformação de Filtro, mas a única diferença é que a transformação de filtro usa apenas uma condição de transformação e retorna as linhas que não cumprem a condição, enquanto a transformação de roteador usa várias condições de transformação e retorna as linhas que correspondem até mesmo a uma única condição.
Q # 23) O que é transformação de classificação?
Responda: A transformação de classificação está ativa e também conectada. É usado para classificar e classificar um conjunto de registros superior ou inferior. Também é usado para selecionar dados com o maior ou o menor valor numérico com base em uma porta específica.
Q # 24) O que é Índice de Classificação na transformação de Classificação?
Responda: O índice de classificação é atribuído pelo designer da tarefa a cada registro. A porta do índice de classificação é usada para armazenar a posição de classificação para cada linha. A transformação de classificação identifica cada linha de cima para baixo e atribui o Índice de classificação.
P # 25) O que é código de status na INFORMATICA?
Responda: O código fornece um mecanismo de tratamento de erros durante cada sessão. O código de status é emitido pelo procedimento armazenado para reconhecer se foi confirmado com sucesso ou não e fornece informações ao servidor INFORMATICA para decidir se a sessão deve ser interrompida ou continuada.
Q # 26) O que são dimensões de lixo?
Responda: Dimensão de lixo é uma estrutura que consiste em um grupo de alguns atributos de lixo, como códigos aleatórios ou sinalizadores. Ele forma uma estrutura para armazenar códigos relacionados com relação a uma dimensão específica em um único lugar, em vez de criar várias tabelas para o mesmo.
P # 27) O que é Mapplet na Informatica?
Responda: Mapplet é um objeto reutilizável que contém um determinado conjunto de regras para transformação e lógica de transformação que pode ser usado em vários mapeamentos. O mapplet é criado no Mapplet Designer na ferramenta de designer.
Q # 28) O que é Decode na Informatica?
Responda: Para entender o Decode, vamos considerá-lo semelhante à instrução CASE no SQL. É basicamente a função que é usada por uma transformação de expressão para pesquisar um valor específico em um registro.
Pode haver pesquisas ilimitadas dentro da função Decode onde uma porta é especificada para retornar valores de resultados. Esta função é geralmente usada nos casos em que é necessária para substituir instruções IF aninhadas ou para substituir valores de pesquisa pesquisando em pequenas tabelas com valores constantes.
Decodificar é uma função usada na transformação de Expressão. É usado exatamente como a instrução CASE em SQL para pesquisar um registro específico.
Abaixo está um exemplo simples de um CASE em SQL:
Sintaxe:
SELECT EMPLOYEE_ID, CASE WHEN EMPLOYEE_AGE <= 20 THEN 'Young' WHEN EMPLOYEE_AGE> 30 AND AGE <= 40 THEN 'Knowledgeable' WHEN EMPLOYEE_AGE> 40 AND AGE = 60 THEN ‘Wise’ ELSE ‘Very Wise’ END AS EMPLOYEE_WISDOM FROM EMPLOYEE
P # 29) O que é transformação de Joiner em INFORMATICA?
Responda: Com a ajuda da transformação de Joiner, você pode fazer uso de Joins em INFORMATICA.
Baseia-se em duas fontes, a saber:
- Fonte mestre
- Fonte de detalhes
As seguintes junções podem ser criadas usando a transformação de Joiner como em SQL.
- Junção normal
- Full Outer Join
- Junção externa mestre (junção externa direita)
- Detalhe da junção externa (junção externa esquerda)
P # 30) O que é transformação de agregador em INFORMATICA?
Responda: A transformação de agregador pode estar ativa ou conectada. Funciona como a cláusula GROUP BY no SQL. É útil realizar cálculos agregados em grupos no INFORMATICA PowerCenter. Ele executa um cálculo agregado nos dados usando a função do tipo agregado viz. SUM, AVG, MAX e MIN.
P # 31) O que é Transformação de Gerador de Sequência em INFORMATICA?
Responda: A Transformação do Gerador de Sequência pode ser passiva ou conectada. Seu uso básico é gerar valor inteiro com NEXTVAL e CURRVAL.
P # 32) O que é Transformação Sindical em INFORMATICA?
Responda: A transformação de união é usada para combinar os dados de diferentes origens e enquadrá-los com a mesma porta e tipo de dados. É muito parecido com uma cláusula em SQL.
P # 33) O que é Transformação do Qualificador de Origem em INFORMATICA?
Responda: A transformação do Qualificador de origem é útil no mapeamento, sempre que adicionamos arquivos simples relacionais, eles são criados automaticamente. É uma transformação ativa e conectada que representa as linhas que são lidas pelo serviço de integração.
Q # 34) O que é INFORMATICA Worklet?
Responda: O Worklet funciona como um Mapplet com o recurso de reutilização, a única diferença é que podemos aplicar o Worklet a qualquer quantidade de workflows no INFORMATICA, ao contrário do Mapplet. O Worklet salva a lógica e as tarefas em um único local para reutilização.
O worklet é muito semelhante ao mapplet e é definido como o grupo de tarefas que podem ser reutilizáveis ou não reutilizáveis no nível do fluxo de trabalho. Ele pode ser adicionado a quantos fluxos de trabalho forem necessários. Com seu recurso de reutilização, muito tempo é economizado, pois a lógica reutilizável pode ser desenvolvida uma vez e pode ser colocada de onde pode ser reutilizada.
No ambiente INFORMATICA PowerCenter, os mapplets são considerados o recurso mais vantajoso. Eles são criados em designers de mapplet e fazem parte da ferramenta Designer.
Ele basicamente contém um conjunto de transformações que são projetadas para serem reutilizadas em vários mapeamentos.
Os mapplets são objetos reutilizáveis que simplificam o mapeamento por:
- Incluindo várias transformações e definições de origem.
- Não é necessário conectar a todas as portas de entrada e saída.
- Aceite dados de fontes e passe para várias transformações
Bem, em geral, quando é necessário reutilizar a lógica de mapeamento, a lógica deve ser colocada no Mapplet.
P # 35) O que é SUBSTR em INFORMATICA?
Responda: SUBSTR é uma função que extrai ou remove um conjunto de caracteres de um conjunto de caracteres maior.
Sintaxe: SUBSTR (string, início (, comprimento))
Onde,
corda define o caractere que queremos pesquisar.
começar é um número inteiro usado para definir a posição onde a contagem deve começar.
Comprimento é um parâmetro opcional usado para contar o comprimento de uma string para retornar de sua posição inicial.
Por exemplo, SUBSTR (Contato, 5, 8), onde iniciamos no 5º caractere do nosso contato e retornamos para os próximos 8 caracteres.
P # 36) O que é compatibilidade de página de código?
Responda: Quando os dados são transferidos da página de código de origem para a página de código de destino, todas as características da página de origem devem estar presentes na página de destino para evitar a perda de dados, esse recurso é chamado de Compatibilidade de Página de Código.
A compatibilidade da página de código surge quando o servidor INFORMATICA está sendo executado no modo de movimentação de dados Unicode. Nesse caso, as duas páginas de código são consideradas idênticas quando seus caracteres codificados são virtualmente idênticos e, portanto, não resulta em perda de dados.
Para uma precisão total, diz-se que a página de código-fonte é o subconjunto da página de código-alvo.
P # 37) Como você pode diferenciar entre LookUp conectado e LookUp desconectado?
Responda: A pesquisa conectada faz parte do fluxo de dados que está conectado a outra transformação; ela obtém a entrada de dados diretamente de outra transformação que executa uma pesquisa. Ele usa cache estático e dinâmico.
O Unconnected Lookup não obtém a entrada de dados de outra transformação, mas pode ser usado como uma função em qualquer transformação usando a expressão LKP (LookUp). Ele usa o único cache estático.
Q # 38) O que é agregação incremental?
Responda: A agregação incremental é gerada assim que uma sessão é criada. É usado para calcular alterações nos dados de origem que não alteram os dados de destino com alterações significativas.
CUSTOMER_NO | CONTA NÃO | QUANTIA | ENCONTRO |
---|---|---|---|
1001 | 4001 | 1000 | 11/01/2016 |
2001 | 4002 | 2550 | 11/01/2016 |
3001 | 5012 | 4520 | 11/01/2016 |
1001 | 6024 | 2000 | 23/01/2016 |
1001 | 6538 | 5240 | 23/01/2016 |
2001 | 7485 | 5847 | 23/01/2016 |
1515 | 4572 | 6000 | 23/01/2016 |
No primeiro carregamento, a saída é:
CUSTOMER_NO | CONTA NÃO | LOAD_KEY | QUANTIA |
---|---|---|---|
1001 | 4001 | 20011 | 1000 |
2001 | 4002 | 20011 | 2550 |
3001 | 5012 | 20011 | 4520 |
Agora, no segundo carregamento, ele agregará os dados com a data da próxima sessão.
CUSTOMER_NO | CONTA NÃO | LOAD_KEY | QUANTIA | Observações / Operação |
---|---|---|---|---|
1001 | 6538 | 20011 | 8240 | O arquivo de cache é atualizado após a agregação |
2001 | 7485 | 20011 | 8397 | O arquivo de cache é atualizado após a agregação |
3001 | 5012 | 20011 | 4520 | Sem mudança |
5858 | 4566 | 20011 | 3550 | Sem mudança |
1515 | 4572 | 20011 | 6000 | Sem mudança |
P # 39) O que é uma chave substituta?
Responda: Uma surrogate key é um valor inteiro gerado sequencialmente que é usado como outro substituto ou substituição para a chave primária, que é necessária como uma identificação única de cada linha em uma tabela.
A chave primária pode ser alterada frequentemente de acordo com a necessidade, o que torna o processo de atualização mais difícil para um requisito futuro. A chave substituta é a única solução para esse problema.
Q # 40) Qual é a tarefa de Sessão e tarefa de comando?
Responda: A tarefa da sessão é um conjunto de instruções que devem ser aplicadas durante a transferência de dados da origem para o destino usando o comando da sessão. O comando da sessão pode ser um comando pré-sessão ou um comando pós-sessão.
Tarefa de comando é uma tarefa específica que permite que um ou vários comandos shell do UNIX sejam executados no Windows durante o fluxo de trabalho
P # 41) Qual é a tarefa de comando independente?
Responda: A tarefa de comando independente pode ser usada para executar o comando Shell em qualquer lugar e a qualquer hora no fluxo de trabalho.
Q # 42) O que é fluxo de trabalho? Quais são os componentes do Workflow Manager?
Responda: Fluxo de trabalho é a maneira pela qual a tarefa deve ser implementada. É uma coleção de instruções que informam o servidor sobre como implementar a tarefa.
A seguir estão os três principais componentes do Workflow Manager:
- Designer de Tarefas
- Desenvolvedor de Tarefas
- Designer de Fluxo de Trabalho
Q # 43) O que é o evento e quais são as tarefas relacionadas a ele?
Responda: O evento pode ser qualquer ação ou função que ocorre no fluxo de trabalho.
Existem duas tarefas relacionadas a ele, que incluem:
- Tarefa de Espera de Evento: Esta tarefa espera até que um evento ocorra, uma vez que o evento seja disparado, esta tarefa é realizada e atribui a próxima tarefa.
- Tarefa de aumento de eventos: A tarefa Aumento de evento aciona o evento específico no fluxo de trabalho.
Q # 44) O que é um evento predefinido e um evento definido pelo usuário?
Responda: Os eventos predefinidos são eventos definidos pelo sistema que esperam até a chegada de um arquivo específico em um local específico. Também é chamado de evento File-Watcher.
Os eventos definidos pelo usuário são criados pelo usuário para aumentar a qualquer momento no fluxo de trabalho depois de criados.
Q # 45) O que é o Designer de Destino e a Ordem de Carregamento de Destino?
Responda: O Target Designer é usado para definir o destino dos dados.
Quando há várias fontes ou uma única fonte com várias partições vinculadas a diferentes destinos por meio do servidor INFORMATICA, o servidor usa a Ordem de Carregamento de Destino para definir a ordem em que os dados devem ser carregados em um destino.
Q # 46) O que é a área de teste?
Responda: A área de preparação é um banco de dados onde as tabelas temporárias conectadas à área de trabalho são armazenadas ou tabelas de fatos para fornecer entradas para processamento de dados.
Q # 47) Qual é a diferença entre STOP e ABORT?
Resposta: As diferenças são as seguintes:
- PARE O comando é executado na tarefa Sessão, uma vez que é gerado, o serviço de integração para apenas de ler os dados na fonte de dados, mas continua processando e gravando no destino.
- ABORTO comando é usado para parar completamente o serviço de integração de ler, processar e gravar dados no destino. Ele tem seu próprio tempo limite de 60 segundos para concluir o processamento e a gravação de dados por meio do serviço de integração, caso contrário, ele simplesmente elimina a sessão.
Q # 48) Quais são os diferentes caches LookUp?
Responda: A pesquisa pode ser armazenada em cache ou sem cache. Basicamente, está dividido em cinco partes.
Eles estão:
- Cache Estático
- Cache Dinâmico
- Recache
- Cache Persistente
- Cache Compartilhado
O cache estático permanece como está sem alterações durante a execução de uma sessão.
O Cache Dinâmico continua sendo atualizado com frequência durante a execução de uma sessão.
Q # 49) Como atualizar a definição da fonte?
Responda: Existem duas maneiras de atualizar a definição de origem.
Eles estão:
- Você pode editar a definição de origem existente.
- Você pode importar uma nova fonte do banco de dados.
P # 50) Como implementar medidas de segurança usando um gerenciador de repositório?
Responda: Existem 3 maneiras de implementar medidas de segurança.
Eles estão:
- Permissão de pasta dentro de proprietários, grupos e usuários.
- Bloqueio (Ler, Gravar, Recuperar, Salvar e Executar).
- Privilégios de repositório viz.
- Navegue no Repositório.
- Use o Workflow Manager (para criar sessões e lotes e definir suas propriedades).
- Operador de fluxo de trabalho (para executar sessões e lotes).
- Use Designer, Admin Repository (permite que qualquer usuário crie e gerencie o repositório).
- Usuário Admin (permite ao usuário criar um servidor de repositório e definir suas propriedades).
- SuperUser (todos os privilégios são concedidos ao usuário).
Q # 51) Conte com as vantagens da INFORMATICA.
Responda: Por ser considerada a ferramenta de integração de dados preferida, há várias vantagens que precisam ser consideradas.
Eles estão:
- Ele pode comunicar e transformar os dados de maneira eficaz e muito eficiente entre diferentes fontes de dados como Mainframe, RDBMS, etc.
- Geralmente é um aprendizado muito mais rápido, robusto e fácil do que qualquer outra plataforma disponível.
- Com a ajuda do INFORMATICA Workflow Monitor, as tarefas podem ser facilmente monitoradas, as tarefas com falha podem ser recuperadas, bem como as tarefas de execução lenta podem ser apontadas.
- Possui recursos como fácil processamento de informações de banco de dados, validação de dados, migração de projetos de um banco de dados para outro, desenvolvimento de projetos, iteração, etc.
Q # 52) Liste algumas áreas ou situações em tempo real onde INFORMATICA é necessária.
Responda: Armazenamento de dados, integração de dados, migração de dados e migração de aplicativos de uma plataforma para outras plataformas são alguns exemplos de áreas de uso em tempo real.
Q # 53) Explique o programa ETL com alguns exemplos.
Responda: Conhecida por sua exclusividade, a ferramenta ETL significa Extrair, Transformar e Carregar ferramenta que basicamente resolve o propósito de extrair dados e enviar para algum lugar conforme definido, alterando-os.
Para ser muito preciso:
- A tarefa de extração é coletar os dados de fontes como banco de dados, arquivos, etc.
- A transformação é considerada como a alteração dos dados recebidos da fonte.
- O carregamento define o processo de alimentação dos dados alterados para o destino definido.
Para entender de forma técnica, a ferramenta ETL coleta dados de fontes heterogêneas e os altera para torná-los homogêneos para que possam ser usados posteriormente para análise da tarefa definida.
Alguns exemplos básicos de programas incluem:
- Os mapeamentos derivam o processo ETL de leitura de dados de suas fontes originais, onde o processo de mapeamento é feito no designer.
- Os fluxos de trabalho consistem em várias tarefas que são decididas e projetadas na janela do Workflow Manager.
- A tarefa consiste em um conjunto de várias etapas que determinam a sequência de ações a serem realizadas durante o tempo de execução.
Q # 54) Liste as diferenças entre Banco de Dados e Data Warehouse.
Responda: Consulte a tabela abaixo para entender as diferenças entre os dois:
qual é a melhor ide para python
Base de dados | Armazém de dados |
---|---|
Ele armazena / registra os dados atuais e atualizados que são usados nas operações diárias | Ele armazena / analisa dados históricos que são usados para suporte de informações em uma base de longo prazo. |
Sua orientação está no processamento de transações online que inclui transações simples e curtas. | Sua orientação está no Processamento Analítico Online que inclui consultas complexas. |
Consiste em dados detalhados e primitivos onde sua visão é relacional plana. | Consiste em um dado consolidado resumido onde sua visão é multidimensional. |
Baixo desempenho é observado para consultas analíticas. | As consultas analíticas são julgadas aqui como de alto desempenho. |
A eficiência é determinada medindo o rendimento da transação. | A eficiência é determinada medindo o rendimento da consulta e o tempo de resposta. |
Q # 55) Explique os recursos da pesquisa Conectado e Desconectado.
Resposta: Os recursos do Connected Lookup podem ser explicados da seguinte forma:
- Há uma fonte direta de entrada do pipeline para pesquisa conectada.
- Ele tem participação ativa no fluxo de dados e tanto o cache dinâmico quanto o estático são usados conforme o caso.
- Ele armazena em cache todas as colunas de pesquisa e retorna os valores padrão como saída quando a condição de pesquisa não corresponde.
- Mais de um valor de coluna pode ser retornado à porta de saída.
- Vários valores de saída são passados, bem como portas de saída são vinculadas a outra transformação.
- A pesquisa conectada oferece suporte a valores padrão definidos pelo usuário.
Os recursos da pesquisa não conectada podem ser explicados da seguinte maneira:
- A pesquisa não conectada usa cache estático e sua fonte de entrada é o resultado recebido da saída da expressão LKP.
- Ele armazena em cache apenas as portas de saída de pesquisa e retorna o valor como NULL quando a condição de pesquisa não corresponde.
- Apenas uma coluna é retornada de cada porta.
- Apenas um valor de saída é passado para outra transformação.
- Os valores padrão definidos pelo usuário não são suportados pela pesquisa desconectada.
Q # 56) Durante a sessão de execução, os arquivos de saída são criados pelo servidor Informatica. Aliste alguns deles.
Responda: Mencionados abaixo estão os poucos arquivos de saída:
- Arquivos de cache: Esses arquivos são criados no momento da criação do cache de memória. Para circunstâncias como transformação de Pesquisa, transformação de Agregador, índice etc. e arquivos de cache de dados são criados pelo servidor Informatica.
- Arquivo de detalhes da sessão: Conforme o nome define, este arquivo contém estatísticas de carga como nome da tabela, linhas rejeitadas ou gravadas para cada destino no mapeamento e pode ser visualizado na janela do monitor.
- Arquivo de detalhes de desempenho: Este arquivo faz parte da folha de propriedades da sessão e contém informações sobre o desempenho da sessão para determinar áreas de melhoria.
- Registro do servidor INFORMATICA: O servidor cria um log para todos os status e mensagens de erro e pode ser visto no diretório inicial.
- Arquivo de log da sessão: Para cada sessão, o servidor cria um arquivo de log de sessão dependendo do nível de rastreamento definido. As informações que podem ser vistas nos arquivos de log sobre as sessões podem ser:
- Processo de inicialização da sessão,
- Criação de comandos SQL para threads de leitor e gravador,
- Lista de erros encontrados e
- Resumo de carga
- E-mail pós-sessão: Isso ajuda a comunicar as informações sobre a sessão (sessão concluída / falha na sessão) para os destinatários desejados automaticamente.
- Rejeitar arquivo: Este arquivo contém informações sobre os dados que não foram usados / gravados nos destinos.
- Arquivo de controle: No caso, quando a sessão usa o carregador externo, o arquivo de controle consiste em instruções de carregamento e formato dos dados sobre o arquivo de destino.
- Arquivo indicador: Este arquivo contém basicamente um número que destaca as linhas marcadas para INSERT / UPDATE / DELETE ou REJECT.
- Arquivo de saída: O arquivo de saída é criado com base nas propriedades do arquivo.
Q # 57) Como diferenciar entre as transformações ativa e passiva?
Responda: Para entender a diferença entre as transformações ativas e passivas, vejamos suas características que irão explicar as diferenças de uma maneira melhor.
A ação realizada pelas transformações ativas inclui:
- Alterar o número de linhas conforme o requisito, que passa pelas transformações. Por exemplo, Transformação de filtro que exclui a linha que não atende à condição.
- Alterar o limite da transação definindo os pontos de reversão e confirmação. Por exemplo, Transformação de controle de transação.
- Alterando o tipo de linha para INSERT / UPDATE / DELETE ou REJECT.
A ação realizada por transformações passivas inclui:
- O número de linhas que passam pela transformação nunca é alterado.
- O limite da transação está definido.
- O tipo de linha está definido.
Q # 58) Liste os vários tipos de Transformações.
Resposta: Os vários tipos de transformações são os seguintes:
- Transformação de agregador
- Transformação de expressão
- Transformação de normalizador
- Transformação de classificação
- Transformação de filtro
- Transformação de marceneiro
- Transformação de pesquisa
- Transformação de procedimento armazenado
- Transformação de classificação
- Transformação da estratégia de atualização
- Transformação do qualificador de origem XML
- Transformação de roteador
- Transformação de gerador de sequência
P # 59) O que é cache dinâmico?
Responda: As pesquisas INFORMATICA podem ser categorizadas como armazenadas em cache ou não armazenadas em cache. No caso do cache dinâmico, as linhas podem ser inseridas ou excluídas no momento da passagem das linhas e são sincronizadas com o destino. A memória cache é atualizada todas as vezes após as operações de exclusão / atualização na sessão.
Q # 60) O que é decodificar em cache estático?
Responda: Cache estático é aquele que não é atualizado nem atualizado na execução da sessão. É o cache padrão e retorna o valor apenas quando a condição de retorno é verdadeira. Em outros casos, ele retorna um valor Nulo. A inserção ou atualização do cache não pode ser executada neste caso.
P # 61) Mencione algumas vantagens da transformação de Roteador em relação à transformação de Filtro.
Responda: A transformação de roteador e a transformação de filtro são iguais porque ambas usam uma condição para testar e filtrar os dados.
No entanto, as vantagens do Roteador sobre a transformação do filtro podem ser compreendidas pelos pontos mencionados abaixo.
Transformação do roteador:
- Ele permite mais de uma condição de teste.
- Fornece a capacidade de testar os mesmos dados de entrada em várias condições.
- No caso de mapeamento, os dados de entrada são processados apenas uma vez pelo servidor e, portanto, o desempenho é aprimorado.
- Menos complexo e mais eficiente.
- Os registros que falham na condição de teste nunca são bloqueados, em vez disso, são passados para o grupo padrão.
Q # 62) Conte com algumas propriedades de sessões.
Responda: Uma sessão está disponível no gerenciador de fluxo de trabalho e é configurada criando uma tarefa de sessão. Em um programa de mapeamento, pode haver várias sessões e pode ser reutilizável ou não reutilizável.
Algumas das propriedades da sessão são as seguintes:
- De acordo com o requisito, as tarefas da sessão podem ser executadas simultaneamente ou sequencialmente.
- Uma sessão pode ser configurada para analisar o desempenho.
- Para criar ou executar uma tarefa de sessão, é necessário ter informações gerais sobre o nome da sessão, programação e serviço de integração.
- Outra propriedade importante da sessão inclui o arquivo de log da sessão, a carga de teste, tratamento de erros, intervalo de confirmação, propriedades de destino, etc.
Q # 63) Liste as tarefas para as quais a transformação do qualificador de origem é usada.
Responda: O qualificador de origem é considerado como uma transformação ativa que lê as linhas que estão envolvidas no serviço de integração dentro da sessão em execução. Ele determina a maneira como os dados são buscados na origem e são adicionados automaticamente ao adicionar uma origem ao mapeamento.
A lista de diferentes tarefas em que o qualificador de origem é usado é a seguinte:
- Filtragem de linhas
- Classificação de dados
- Criação de consulta personalizada
- Juntando tabelas da mesma fonte
- Seleção de valores distintos
P # 64) Mencionar alguns aplicativos clientes do Power Center com sua finalidade básica?
Responda: Tarefas como criação de sessão e fluxo de trabalho, monitoramento do andamento do fluxo de trabalho, criação de mapplets, etc., são realizadas por aplicativos cliente do PowerCenter.
A seguir está a lista de aplicativos clientes do PowerCenter com sua finalidade:
- Gerente de repositório: É uma ferramenta administrativa e sua finalidade básica é gerenciar pastas de repositório, objetos, grupos, etc.
- Console de administração: Aqui, as tarefas de serviço como iniciar / parar, backup / restauração, atualização / exclusão, etc. são executadas.
- Projetista do centro de energia: O designer consiste em várias ferramentas de design que servem a vários propósitos. Essas ferramentas de design são:
- Source Analyzer
- Target Designer
- Transformation Developer
- Mapplet Designer
- Gerente de mapeamento
- Workflow Manager: Seu objetivo básico é definir um conjunto de instruções / fluxo de trabalho necessário para executar os mapeamentos projetados no designer. Para ajudar a desenvolver um fluxo de trabalho, existem 3 ferramentas disponíveis, a saber, desenvolvedor de tarefas, designer de fluxo de trabalho, designer de worklet.
- Monitor de fluxo de trabalho: Como o nome sugere, o monitor de fluxo de trabalho monitora o fluxo de trabalho ou tarefas. A lista de janelas disponíveis é:
- Janela do navegador
- Janela de saída
- Janela de oportunidade
- Janela de propriedades
- Exibição de tarefa
- Gráfico de Gantt
Conclusão
Espero que agora você já tenha uma ideia clara sobre a ferramenta e o tipo de perguntas que serão feitas nas entrevistas.
INFORMATICA é a melhor solução para realizar Integração de Dados. Ele funciona com gerenciamento de multi-dados em um ambiente de multi-plataforma, como Windows, Linux, Unix, etc. e é testado em mais de 50.000 plataformas para melhores resultados e melhor desempenho entre várias outras.
Em suma, INFORMATICA é uma ferramenta ETL que reúne informações ou dados de várias fontes e carrega essas informações para os destinos específicos definidos sem realmente salvá-los. Sua tarefa é fornecer vários serviços e recursos para diferentes máquinas e, portanto, os dados entregues devem estar corretos com resultados notáveis.
Atualize o conhecimento sobre os conceitos da Informatica por meio deste artigo e prepare-se para a entrevista imediatamente.
Muito bem sucedida!!!
Leitura recomendada
- Perguntas e respostas da entrevista
- Perguntas e respostas da entrevista de teste de ETL
- Algumas perguntas e respostas complicadas de testes manuais
- As 32 melhores perguntas e respostas da entrevista de datastage
- Principais perguntas e respostas da entrevista do Teradata
- As 30 principais perguntas e respostas da entrevista do SAS
- As 24 principais perguntas da entrevista de modelagem de dados com respostas detalhadas
- As 10 melhores ferramentas de análise de dados para gerenciamento de dados perfeito (2021 LIST)
- Recurso de pool de dados no IBM Rational Quality Manager para gerenciamento de dados de teste
- Conceito, processo e estratégia de gerenciamento de dados de teste
- As 14 melhores ferramentas de gerenciamento de dados de teste em 2021