Resumo: O artigo pretende fazer uma análise de tecnologias baseadas em Inteligência Artificial como é o caso do data mart, data mining e data warehouse para auxiliar na tomada de decisão do gestor de organizações tecendo relações com a gestão do conhecimento. Utilizou-se a revisão de literatura para compreender como a as ferramentas de Descoberta de Conhecimento (KDD) exploradas neste texto poderiam contribuir no que se considerou como boas práticas em gestão do conhecimento e na tomada de decisão. Tais tecnologias foram eleitas para análise por trabalharem com amplo volume de dados, sendo de grande utilidade em empresas que objetivam conhecer perfil de usuários e padrões de consumo e motivações, a fim de agregar valor ao negócio, sob a visão do business inteligence. Com relação a diferenças entre estas tecnologias se pode dizer que, enquanto o business inteligence atua no plano tácito de uma organização, as ferramentas tecnológicas trabalhadas neste artigo, atuam no plano estratégico, oferecendo, quando bem utilizadas, informações privilegiadas aos seus gestores.
Palavras-chave:
Data warehouse; Data mart; Data mining; Inteligência artificial; Gestão
do conhecimento; Descoberta de conhecimento.
Abstract:
The article aims at an analysis of technology-based
Artificial Intelligence such as the data mart, data mining and data
warehouse to assist in decision-making manager organizations build
relationships with the management of knowledge. These technologies were
elected to analysis by working with large volume of data being useful in
companies that aim to meet user's profile and consumption patterns and
motivations in order to add value to business, under the vision of business
intelligence. Regarding the differences between these technologies can be
said that while the acts in the business intelligence tacit plan of an
organization, technology tools worked this article, work in the strategic
plan, providing, as well used inside information to managers.
Keywords:
Data mart. Data mining. Data warehouse. Knowledge management. Artificial
intelligence. Knowledge discovery.
Introdução
Ao se abordar a relação existente entre tecnologias
da informação, como o data warehouse, o
data mart e o
data mining,
com a gestão do conhecimento, entende-se como indispensável à apresentação
de conceitos pertinentes a cada uma das áreas. Porque apesar destas
tecnologias serem utilizadas por gestores, em muitos casos, estes gestores
tornam-se reféns destas tecnologias. Portanto busca-se através de revisão de
literatura estreitar a relação existente entre as áreas de desenvolvimento e
de aplicação (uso); apresentando a seguir os conceitos que consideramos
principais nesta relação interdisciplinar.
Para tanto se busca conceituar inteligência artificial, área da ciência da
computação criada formalmente em 1956, através da qual foram desenvolvidas
as tecnologias apresentadas neste texto. A inteligência artificial pode ser
considerada, de acordo com Wiston (1992): “O estudo das
operações que fazem possível perceber, raciocinar e atuar”, ou ainda
segundo Schalkoff (1990): “O campo de estudo que tenta
explicar e emular comportamento inteligente em termos de processo
computacional”. Pode-se considerar então a inteligência artificial - IA
como a área do conhecimento que estuda faculdades mentais humanas na busca
por sua representação e implementação, a fim de simular e reproduzir essas
faculdades através da criação de mecanismos ou entidades inteligentes.
Objetivos
O artigo pretende fazer uma análise teórica das tecnologias baseadas em
inteligência artificial para auxiliar na tomada de decisão do gestor da
organização, a saber: o data mart, o data warehouse e o data mining.
Tecem-se relações destas tecnologias de descoberta de conhecimento com a
gestão do conhecimento, bem como se busca apresentar o cenário e algumas
contextualizações com a sociedade do conhecimento e a tomada de decisão.
Tais tecnologias foram eleitas para serem discutidas neste texto por
trabalharem com grande volume de dados, sendo de ímpar utilidade em empresas
que objetivam conhecer perfil de usuários, seus padrões de consumo e suas
motivações, a fim de agregar valor ao negócio, sob a visão do business
inteligence.
Metodologia
Utilizou-se a revisão de literatura para compreender como a as ferramentas
de descoberta de conhecimento,
KDD
exploradas neste texto poderiam contribuir no que se considerou como boas
práticas em gestão do conhecimento e na tomada de decisão. Procurou-se
explorar, a partir dos dados levantados com a revisão da literatura,
considerações acerca da sociedade do conhecimento.
Mudanças no contexto da sociedade do conhecimento
Grandes mudanças ocorreram na sociedade contemporânea. Mudanças estas que
trouxeram consigo o emblema de uma nova sociedade, a sociedade do
conhecimento. Sabe-se que esta mudança não se deu, nem se dá de forma
homogênea em todos os continentes do mundo nem mesmo dentro de um mesmo
país. O Brasil, por exemplo, apesar de contar com grandes pesquisas de
ponta, consideráveis investimentos em pesquisa e desenvolvimento, e sediar
empresas nacionais que operam com grande volume de exportação, ainda falta
muito para se caracterizar como sendo uma sociedade do conhecimento. Grande
parcela de sua população permanece alheia à informação e mais ainda ao
conhecimento. Neste cenário, coexistem empresas investindo em tecnologia
avançada e também povoados sem energia elétrica. Porém, para que esta
situação se altere, a renda seja mais bem distribuída e o conhecimento
disseminado, é necessário que, entre outras providências, se invista em
educação e pesquisa.
O que mais chama a atenção na promessa da sociedade do conhecimento é o
axioma defendido quanto ao crescimento do conhecimento quando compartilhado.
Este novo paradigma, obscurecido pelo ideal capitalista de acúmulo de
conhecimento para geração de riqueza, vem à tona nos discursos dos
defensores desta nova ideologia de sociedade. As atividades humanas, na
promessa desta nova sociedade, deixam de ser de manipulação para serem de
controle, objetivando chegar a atividades de supervisão. Ou seja, máquinas
operando no lugar de homens.
Surge então a figura do cérebro de obra, que vem a ser o profissional que,
ao invés de vender sua força de trabalho (mão de obra), vende suas idéias,
sua visão de analista e de sintetizador de soluções: os profissionais do
conhecimento (engenheiro do conhecimento e gestores do conhecimento,
dentre outras novas profissões nesta área).
Uma sociedade, ao deixar de ser industrial para se tornar uma sociedade do
conhecimento, alguns fatores se fazem imprescindíveis e outros inevitáveis,
ainda que negativos. Dentre eles se destaca o novo papel do Estado, que
passa a atuar como estimulador do desenvolvimento sustentável seja como
indutor, promotor ou financiador, evitando ser o protagonista no campo
econômico; mudanças demográficas como as relacionadas ao êxodo rural e à
geração dos bolsões de pobreza, como crescimento desordenado dos grandes
centros urbanos, para onde migraram os legados do meio rural, criando uma
diáspora social e cultural; o aumento da expectativa de vida do brasileiro e
a diminuição das taxas de natalidade gerando pragmaticamente a problemática
da sustentabilidade da previdência social; o desenvolvimento científico e
tecnológico servindo como pano de fundo para o crescimento econômico do país
(porém não especificamente o crescimento econômico do povo como um todo,
uma vez que a riqueza e o lucro ainda estão centrados nas mãos de poucos).
Além dos fatores citados, consideramos ainda a conscientização da
importância na preservação dos recursos naturais e do meio ambiente como
forma de manter o equilíbrio planetário e a garantir a existência humana. A
customização da produção, através de trabalhadores multifuncionais, que
deixaram de produzir em série (modelos fordista e taylorista) para
uma produção mais customizada e mais participativa, através das competências
desenvolvidas pela necessidade de maiores níveis de escolaridade e de
competências (até mesmo pelo receio à obsolescência e substituição em
seus postos de trabalho, tanto pela máquina quanto por indivíduos mais bem
preparados e especialistas).
Quanto à gestão empresarial esta aposta no conhecimento como maior fator de
produção, buscando diferenciar conhecimento tácito de explícito, procurando
entender primeiramente o conhecimento tácito (aquele que ainda não foi
sistematizado e está na mente de cada indivíduo) para levar este
conhecimento ao plano estratégico, de maneira explícita e documentada,
visando a mudança do modelo mental da organização, a fim de fundamentar e
aperfeiçoar processos e tomadas de decisões.
Logo se percebe que, com as mudanças ocorridas através do novo paradigma da
sociedade do conhecimento (quer este paradigma tenha sido forjado,
empurrado goela abaixo, mobilizando forças simbólicas, segundo
Mattelart (2002), quer não, o fato é que elas se impõem), alteram o
modus operandi da sociedade na alta modernidade através de fatores
influenciadores principalmente como as tecnologias da informação e
comunicação (TICs) em conjunto com as redes de comunicação (internet).
O conhecimento, matéria-prima desta sociedade, pode ser classificado em uma
tipologia histórica que vai desde o século XV com o conhecimento dos
manuscritos até o século XXI, multiplicado e potencializado pelo
conhecimento digital e hipertextual. Conhecimento este que precisa ser
difundido, compartilhado e principalmente tratado e recuperado para ser
disseminado; mas não mais através da história oral (a memória mesmo que
coletiva não daria mais conta de armazenar o conhecimento acumulado pela
sociedade), ou mesmo dos livros impressos (a velocidade de criação e a
obsolescência científica crescem em termos exponenciais). Gerir a
informação passou a ser tarefa complexa.
E, de acordo com Milanesi (1983, p. 74): “Se as informações não puderem chegar ao seu objetivo, não se realiza a comunicação, o que não é desejável, inclusive economicamente”. Ao longo de uma trajetória que vai desde as grandes bibliotecas, que exerceram durante muito tempo o papel das instituições que armazenavam o conhecimento da humanidade até chegar à internet (nova modalidade de biblioteca, apesar de ainda desordenada) a sociedade acostumou-se a aceitar que quanto mais o conhecimento é produzido e publicado, mais potencial se torna o crescimento da ignorância e da obsolescência. Ambos são fatores proporcionais posto que a capacidade humana de absorção da informação está sendo excedida pelo rápido avanço da ciência e da tecnologia e pelo grande volume de dados e informações gerados.
Diante desta realidade sistemas vão sendo desenvolvidos a fim de oportunizar
o acesso ao conhecimento no afã de suplantar esta dificuldade de retenção e
atualização por conhecimento nos indivíduos e empresas. Estes sistemas de
gerenciamento de dados possuem objetivos como armazenamento e recuperação da
informação. As demais características vão ao encontro do que cada
organização espera e necessita.
Neste trabalho o interesse está nos sistemas que lidam com grandes volumes
de dados e que visam auxiliar as empresas e organizações a gerirem as
informações geradas por elas ou informações que de algum modo a elas
interessam e estão armazenadas em seus bancos de dados. Estes sistemas se
bem configurados e bem utilizados, ou seja, se relacionados com os objetivos
de cada empresa ao fazer uso do sistema, podem oferecer ganhos vantajosos às
empresas, auxiliando-as a interpretar e classificar seus dados, buscando
transformá-los em conhecimento.
A gestão do conhecimento (GC) está no cerne destas
mudanças paradigmáticas e busca se beneficiar com novas metodologias de
desenvolvimento e de aplicação rumo ao desenvolvimento de capital
intelectual e financeiro. Ela é uma das áreas que pode se beneficiar com os
sistemas de mineração e armazém de dados. Para entender de que modo a gestão
do conhecimento pode se beneficiar das tecnologias de inteligência
artificial voltadas para o tratamento de grandes volumes de dados é preciso
conhecê-la. Pode-se perceber a gestão do conhecimento como uma área do
conhecimento que lida com a organização das principais políticas, processos
e ferramentas gerenciais e tecnológicas em busca de uma melhor compreensão
dos processos de geração, identificação, validação, disseminação,
compartilhamento e uso dos conhecimentos estratégicos, objetivando gerar
resultados econômicos para a empresa e benefícios para os outros
colaboradores. (Terra, 2005)
Ela utiliza-se de tecnologias na área de tratamento de grandes volumes de
dados que podem contribuir para a geração do conhecimento e a tomada de
decisões acertadas por parte dos gestores do conhecimento. Tais ferramentas
e tecnologias são geralmente desenvolvidas pela área de engenharia de
software, porém através de uma visão contemporânea, analisa-se que estas
ferramentas necessitam da participação de seus usuários desde o momento de
seu desenvolvimento até sua avaliação, posto que é para atender às
necessidades dos usuários que elas são desenvolvidas. Estes sistemas
fazem parte do processo denominado Descoberta de Conhecimento em Banco de
Dados (KDD) os quais realizam uma análise exploratória
de dados com a possibilidade da descoberta de informações implícitas, que
possam ser úteis para as organizações. (Morales, 2008)
Tecnologias auxiliares na gestão do conhecimento
Aborda-se nesta seção algumas das tecnologias que foram criadas visando
oferecer às organizações apoio no tratamento de grandes volumes de dados.
Fala-se de tecnologias como o data warehouse, o data mining e o data mart.
A seguir se apresenta cada uma delas através de algumas de suas
características e peculiaridades. Porém, se considera e se tenta demonstrar
que nenhum destes sistemas baseados em conhecimento é capaz de superar a
interpretação do homem. Os sistemas apresentados são capazes de cruzar dados
e informações, identificar padrões, porém nenhum deles supera competências
humanas no que tange a tomada de decisão.
Estes sistemas de informação possuem alta capacidade estatística e de
mineração de dados em busca de padrões, porém são “cegos” diante do que
fazer com elas no tocante àquelas decisões que necessitam, por exemplo, ser
baseadas no empirismo (experiência) e no senso comum, as quais muitas vezes
precisam ser levadas em conta no gerenciamento de uma empresa. Estes
sistemas analisam dados, porém a decisão final será humana, através do
conhecimento que, para Morales (2008): “é [o conhecimento] quem permite
derivar ou inferir outras informações novas, por elaboração ou por
aprendizado”.
Data Mining (DM)
O data mining é o processo de exploração de grandes volumes de dados
em busca de padrões consistentes, que podem ser entendidos como unidades de
informação que se repetem em dadas circunstâncias, através de regras de
associação ou sequências temporais que visam detectar possíveis
relacionamentos entre variáveis presentes em dado acervo, detectando assim
novos subconjuntos de dados. Um data mining utiliza técnicas de
estatística, de recuperação da informação, de inteligência artificial e de
reconhecimento de padrões. E também faz uso de algoritmos de aprendizagem ou
classificação baseados em redes neurais e estatísticas, capazes de explorar
um conjunto de dados, retirando e auxiliando a identificar padrões nestes
conjuntos de dados, favorecendo a descobertas por conhecimento.
Os passos fundamentais de uma mineração de dados bem sucedida, a partir de
fontes de dados (bancos de dados, relatórios, logs de acesso, transações,
dentre outras) consiste de uma limpeza (consistência, preenchimento de
informações, remoção de ruídos e redundância). Daí derivam os repositórios
organizados (data warehouse e data mart). É a partir deles que se
podem selecionar colunas para serem cruzadas no processo de mineração. Cujo
objetivo é o aparecimento de padrões implícitos, não visíveis facilmente, na
grande massa de dados, que possam servir como informação a ser interpretada
pelos indivíduos, de acordo com seus objetivos.
Apesar de existirem ferramentas que auxiliam na execução dos processos, o
data mining não tem automatização simples, exigindo a sua condução por
profissionais com conhecimento e algum conhecimento em estatística. Uma vez
que técnicas como frequência, histograma,
outliers, medidas de
tendência central (mediana, moda, média), medidas de dispersão e
medidas de correlação devem ser de conhecimento do analista que está
administrando o sistema. Quanto aos algoritmos utilizados para a realização
da classificação dos dados são eles os de abordagem simbólica, baseados em
árvores de decisão; os de abordagem biológica, através de redes neurais e
algoritmos genéticos; e os de abordagem estatística, através dos
classificadores bayesianos (algoritmo de Naive-Bayes), k-vizinhos
mais próximos.
Uma das medidas utilizadas nestes sistemas é a
Medida de
Similaridade, a qual se pode dizer que fornece valores que demonstram a
“distância” entre dois objetos. E, quanto menor for o valor, mais
semelhantes então são os objetos, devendo ficar armazenados no mesmo
cluster. Porém é preciso compreender que não existe medida de similaridade
que sirva para todas as variáveis (tipos de) em uma mesma base de
dados. Existem vários modelos de softwares no mercado e também ferramentas
livres que podem ser utilizadas como sistemas de data mining dentre
eles destaca-se o
KDB2000 que é uma ferramenta livre desenvolvida em
C++, a qual integra acesso à
base de dados, pré-processamento, técnicas de transferência e um vasto
escopo de algoritmos de mineração. Há também o multifactor dimensionality
reduction MDR, que é uma ferramenta livre desenvolvida em Java criada para
detecção de interações entre atributos utilizando o método multifactor
dimensionality reduction ; tem ainda o KNIME,
plataforma de mineração de dados open source, para citar alguns.
Data warehouse (DW)
Um data warehouse é entendido literalmente como um depósito ou armazém de
dados. Ele é um sistema utilizado para armazenar informações relativas às
atividades de uma organização em banco de dados de forma consolidada. Seu
objetivo é a análise de grandes volumes de dados e a obtenção de informações
estratégicas que podem facilitar a tomada de decisões.
O data warehouse retira os dados os quais analisa, de sistemas transacionais
tipo Online Transaction Processing ou Processamento
OLTP, as chamadas séries históricas, que possibilitam uma melhor
análise de eventos passados, oferecendo suporte à tomada de decisões e a
previsão de eventos futuros.
Os dados de um data warehouse, por definição não são voláteis, ou seja, não
mudam e não se alteram. Eles são disponíveis somente para leitura não
podendo teoricamente ser alterados.O surgimento do data warehouse se deu
como conceito acadêmico na década de 1980. Por sua capacidade de sumarizar e
analisar grandes volumes de dados, o data warehouse é o núcleo dos sistemas
de informações gerenciais e de apoio à decisão das principais soluções de
business inteligence do mercado.
Como business inteligence, se pode entender, de acordo com Morales (2008): “Um conjunto de conceitos, metodologias e tecnologias que, fazendo uso de acontecimentos (fatos) e sistemas baseados nos mesmos, apóia a tomada de decisões.” É importante entender como um data warehouse trabalha. Ele possui um repositório de metadados, que é uma ferramenta essencial para o seu gerenciamento, no momento de converter dados em informações sobre a sua origem, as regras de transformação, nomes e alias, formato de dados, etc.. Este repositório deve conter informações (rótulos) que adicionem valor aos dados, bem como univocidade aos mesmos.
Por univocidade compreende-se a relação existente entre um termo (metadado)
e dado conceito (sua semântica). Esta relação necessita ser original
no que diz respeito a não poder haver no mesmo repositório o mesmo termo
para representar conceitos diferentes e vice e versa, ou seja, não é aceito
que haja o mesmo significado para termos diferentes. Esta falha, quando
presente em um sistema, ocasiona ausência de padronização e de consistência,
prejudicando assim o tratamento dos dados e conseqüentemente sua
interpretação.
Data Mart (DM)
Um data warehouse é geralmente acessado através de data marts,
que são pontos específicos de acesso a subconjuntos do data warehouse
. Os data marts são construídos para responder prováveis questionamentos de
um tipo específico de usuário. Por exemplo, um data mart financeiro
poderia armazenar informações consolidadas diariamente para usuários
gerenciais ou em periodicidades maiores (semanalmente, mensalmente,
anualmente), pré-definidas, por exemplo, por usuários no nível da
diretoria da empresa.
Contemporaneamente os conceitos de data warehouse e data mart fazem
parte de um conceito muito maior denominado de
Corporate Performance Management, que vem a ser um modelo de
administração empresarial objetivando melhores performances e resultados
dentro da organização, através da análise e consolidação da tomada de
decisões a partir do auxílio do tratamento dos dados vindos dos sistemas de
informação baseados no conhecimento.
Porém de nada adianta fazer uso de qualquer tecnologia qual seja ela, se os
gestores destes sistemas não tenham definidos os objetivos que desejam
atingir. Estes três sistemas apresentados oportunizam a combinação de
conhecimentos existentes, através da descoberta de padrões que se repetem
nos processos de dada empresa, em dado cenário e dadas circunstâncias, porém
é o gestor do sistema e/ ou empresa quem precisa buscar inovação através da
interpretação ou de novas interpretações e combinações dos conhecimentos
gerados. E, a partir da observância destes conhecimentos evidenciados pelos
sistemas, atingir competência, que vem a ser o conhecimento posto em
prática.
Conclusões
Sistemas de conhecimento têm se tornado cada vez mais utilizados e
necessários frente ao aumento constante de dados e informações, bem como do
grande volume gerado e gerido pelas empresas e organizações. É através
também da evolução, principalmente de hardware e software que as empresas
têm se permitido experimentar novos desafios, antes custosos. É preciso
investir na integração e interoperabilidade entre os sistemas por elas
utilizados. Estes sistemas necessitam incorporar cada vez mais semântica nas
suas soluções, de modo a apoiar tanto os indivíduos quanto às organizações.
Porém não é somente através de investimentos em tecnologia que estas
organizações chegarão a seus objetivos. É preciso mais que tecnologia para
se obter um robusto projeto de gerenciamento empresarial. É preciso traçar
metas e objetivos buscando conhecimento acerca de alterações e novidades,
tanto no meio interno (mudanças dentro da própria empresa) quanto às
alterações externas (ambiente, concorrência, possibilidade de expansão de
mercado, balança comercial), dentre outros aspectos influenciadores de uma
boa (ou má) gestão.
No entanto, ter conhecimento não garante competência. O conhecimento difere
da competência. Esta última é a habilidade de bem utilizar o conhecimento
adquirido. Isto os sistemas informatizados não podem fazer. A habilidade de
bem utilizar a informação transformada em conhecimento precisa ser uma
capacidade do gestor, pois é ele quem irá analisar o conhecimento gerado por
estes sistemas, com base na leitura e comparação de padrões e, com
habilidade, decidirá como agir e empreender, com criatividade e no devido
momento.
A obtenção de padrões gerados a partir de dados interpretados por estes
sistemas de informação apresentados permite agregar valor às decisões da
empresa e gerar tendências, permitindo aos gestores decidirem com maior
qualidade acerca de suas ações e decisões. Os sistemas auxiliam no plano
estratégico da empresa, informando o cruzamento de dados confiáveis e
seguros os quais se pode considerar informação que, se bem interpretada e
analisada gerará conhecimento. Porém como já mencionado estes sistemas podem
ser poderosas ferramentas, mas as informações e decisões que mais irão gerar
impacto em uma empresa serão aquelas relativas à determinação humana.
Referências Bibliográficas
FIALHO, F.;SANTOS, N.; PACHECO, R. C. S. Comentários e anotações na
Disciplina Introdução à engenharia e gestão do conhecimento. Pós-Graduação
em Engenharia e Gestão do Conhecimento, UFSC, Florianópolis, 2008. 1°
trimestre.
MATTELART, A. História da sociedade da informação. Tradução de Nicolas Nyimi
Campanário. São Paulo: Ed. Loyola, 2002.
MILANESI, L. Biblioteca. Cotia, SP: Ateliê Editorial, 2002.
MORALES, A. B. T. Aula sobre Métodos e técnicas de extração de conhecimento.
Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento da UFSC,
Florianópolis, 2008.
SCHALKOFF, R. J. Artificial intelligence: an engineering approach. New York:
McGraw-Hill, c1990.
TERRA, J. C. Definindo gestão do conhecimento. Disponível em:
http://www.ilanet.com.br/cgi-local/portal/bin/view/Ilanet/GestaoDoConhecimento?raw=on
Sobre os autor / About the Author:
Professora na área de Ciência da Informação no Instituto de Ciências Humanas e da Informação da Universidade Federal do Rio Grande (FURG). Mestre em Engenharia de Produção pela Universidade Federal de Santa Maria (UFSM) e doutoranda na Pós-Graduação em Engenharia e Gestão do Conhecimento da Universidade Federal de Santa Catarina (UFSC).