Pré-processamento de Dados e Comparação entre Algoritmos de Machine Learning para a Análise Preditiva de Falhas em Linhas de Produção para o Controlo
| Main Author: | |
|---|---|
| Publication Date: | 2021 |
| Format: | Master thesis |
| Language: | por |
| Source: | Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| Download full: | http://hdl.handle.net/10400.22/18266 |
Summary: | Nos dias de hoje, devido ao constante desenvolvimento tecnológico e à constante necessidade de acelerar o processo de produção, os grandes fabricantes vêem-se obrigados a implementar processos de controlo de qualidade, por forma a diminuir o número de peças defeituosas ao longo das linhas de produção e, dessa forma, aumentar a produtividade das mesmas, o que irá beneficiar, não só as organizações responsáveis por esse processo, como também os clientes, pois, ao reduzir o tempo e custo de produção de um produto, as organizações têm a possibilidade de reduzir o seu preço. Apesar de se tratar de um problema global, este documento apenas se foca nas linhas de produção da Bosch, ao analisar uma grande quantidade de dados que foram disponibilizados para a criação de modelos de machine learning, com o objetivo de prever que componentes irão falhar ao longo do processo, por forma a melhorar o controlo de qualidade nas suas fábricas. Contudo, devido ao elevado número de entradas, estes dados têm que passar por várias etapas, para garantir que se encontram no melhor estado possível para serem testados e treinados pelos algoritmos. Estas etapas englobam o pré-processamento, ou seja, a correção de dados em falta, normalização, redução do tamanho do dataset, entre outras, e a Seleção de Características dos dados, ao selecionar apenas os atributos mais relevantes para a construção do modelo. Para o problema abordado neste documento, optou-se pela utilização da técnica de aprendizagem supervisionada, pelo facto do dataset utilizado ser rotulado, pois cada coluna contém um descritivo da peça, estação e linha de produção. Após terem sido analisados vários artigos semelhantes na mesma área de estudo, e terem sido comparados os seus resultados, os algoritmos XGBoost, Random Forest e Support Vector Machine foram escolhidos como os algoritmos a utilizar no desenvolvimento do modelo. Várias métricas de avaliação foram referidas na literatura como aptas para avaliar o modelo, como é o caso da exatidão, da precisão, da métrica F1, entre outras, que foram utilizadas para esse fim. Por fim, concluiu-se que o XGBoost foi o algoritmo que apresentou os melhores resultados no contexto deste estudo. O algoritmo SVM foi o mais rápido a efetuar as previsões e o algoritmo Random Forest é um meio termo entre velocidade e qualidade dos resultados. O melhor a aplicar nas linhas de produção da Bosch irá depender de que métrica é vista como tendo um maior peso para a organização. |
| id |
RCAP_2a8c8a87d69ce435bbae51d06887a3ed |
|---|---|
| oai_identifier_str |
oai:recipp.ipp.pt:10400.22/18266 |
| network_acronym_str |
RCAP |
| network_name_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| repository_id_str |
https://opendoar.ac.uk/repository/7160 |
| spelling |
Pré-processamento de Dados e Comparação entre Algoritmos de Machine Learning para a Análise Preditiva de Falhas em Linhas de Produção para o ControloMachine LearningAnálise PreditivaFeature EngineeringLinha de ProduçãoClassificaçãoXGBoostRandom ForestSupport Vector MachinePredictive AnalysisProduction LinesClassificationNos dias de hoje, devido ao constante desenvolvimento tecnológico e à constante necessidade de acelerar o processo de produção, os grandes fabricantes vêem-se obrigados a implementar processos de controlo de qualidade, por forma a diminuir o número de peças defeituosas ao longo das linhas de produção e, dessa forma, aumentar a produtividade das mesmas, o que irá beneficiar, não só as organizações responsáveis por esse processo, como também os clientes, pois, ao reduzir o tempo e custo de produção de um produto, as organizações têm a possibilidade de reduzir o seu preço. Apesar de se tratar de um problema global, este documento apenas se foca nas linhas de produção da Bosch, ao analisar uma grande quantidade de dados que foram disponibilizados para a criação de modelos de machine learning, com o objetivo de prever que componentes irão falhar ao longo do processo, por forma a melhorar o controlo de qualidade nas suas fábricas. Contudo, devido ao elevado número de entradas, estes dados têm que passar por várias etapas, para garantir que se encontram no melhor estado possível para serem testados e treinados pelos algoritmos. Estas etapas englobam o pré-processamento, ou seja, a correção de dados em falta, normalização, redução do tamanho do dataset, entre outras, e a Seleção de Características dos dados, ao selecionar apenas os atributos mais relevantes para a construção do modelo. Para o problema abordado neste documento, optou-se pela utilização da técnica de aprendizagem supervisionada, pelo facto do dataset utilizado ser rotulado, pois cada coluna contém um descritivo da peça, estação e linha de produção. Após terem sido analisados vários artigos semelhantes na mesma área de estudo, e terem sido comparados os seus resultados, os algoritmos XGBoost, Random Forest e Support Vector Machine foram escolhidos como os algoritmos a utilizar no desenvolvimento do modelo. Várias métricas de avaliação foram referidas na literatura como aptas para avaliar o modelo, como é o caso da exatidão, da precisão, da métrica F1, entre outras, que foram utilizadas para esse fim. Por fim, concluiu-se que o XGBoost foi o algoritmo que apresentou os melhores resultados no contexto deste estudo. O algoritmo SVM foi o mais rápido a efetuar as previsões e o algoritmo Random Forest é um meio termo entre velocidade e qualidade dos resultados. O melhor a aplicar nas linhas de produção da Bosch irá depender de que métrica é vista como tendo um maior peso para a organização.Marreiros, Maria Goreti CarvalhoREPOSITÓRIO P.PORTOSilva, Daniel Filipe Baptista Ferreira da2021-08-31T10:02:59Z20212021-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.22/18266urn:tid:202758826porinfo:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2025-03-07T10:34:14Zoai:recipp.ipp.pt:10400.22/18266Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-29T01:01:59.528722Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse |
| dc.title.none.fl_str_mv |
Pré-processamento de Dados e Comparação entre Algoritmos de Machine Learning para a Análise Preditiva de Falhas em Linhas de Produção para o Controlo |
| title |
Pré-processamento de Dados e Comparação entre Algoritmos de Machine Learning para a Análise Preditiva de Falhas em Linhas de Produção para o Controlo |
| spellingShingle |
Pré-processamento de Dados e Comparação entre Algoritmos de Machine Learning para a Análise Preditiva de Falhas em Linhas de Produção para o Controlo Silva, Daniel Filipe Baptista Ferreira da Machine Learning Análise Preditiva Feature Engineering Linha de Produção Classificação XGBoost Random Forest Support Vector Machine Predictive Analysis Production Lines Classification |
| title_short |
Pré-processamento de Dados e Comparação entre Algoritmos de Machine Learning para a Análise Preditiva de Falhas em Linhas de Produção para o Controlo |
| title_full |
Pré-processamento de Dados e Comparação entre Algoritmos de Machine Learning para a Análise Preditiva de Falhas em Linhas de Produção para o Controlo |
| title_fullStr |
Pré-processamento de Dados e Comparação entre Algoritmos de Machine Learning para a Análise Preditiva de Falhas em Linhas de Produção para o Controlo |
| title_full_unstemmed |
Pré-processamento de Dados e Comparação entre Algoritmos de Machine Learning para a Análise Preditiva de Falhas em Linhas de Produção para o Controlo |
| title_sort |
Pré-processamento de Dados e Comparação entre Algoritmos de Machine Learning para a Análise Preditiva de Falhas em Linhas de Produção para o Controlo |
| author |
Silva, Daniel Filipe Baptista Ferreira da |
| author_facet |
Silva, Daniel Filipe Baptista Ferreira da |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Marreiros, Maria Goreti Carvalho REPOSITÓRIO P.PORTO |
| dc.contributor.author.fl_str_mv |
Silva, Daniel Filipe Baptista Ferreira da |
| dc.subject.por.fl_str_mv |
Machine Learning Análise Preditiva Feature Engineering Linha de Produção Classificação XGBoost Random Forest Support Vector Machine Predictive Analysis Production Lines Classification |
| topic |
Machine Learning Análise Preditiva Feature Engineering Linha de Produção Classificação XGBoost Random Forest Support Vector Machine Predictive Analysis Production Lines Classification |
| description |
Nos dias de hoje, devido ao constante desenvolvimento tecnológico e à constante necessidade de acelerar o processo de produção, os grandes fabricantes vêem-se obrigados a implementar processos de controlo de qualidade, por forma a diminuir o número de peças defeituosas ao longo das linhas de produção e, dessa forma, aumentar a produtividade das mesmas, o que irá beneficiar, não só as organizações responsáveis por esse processo, como também os clientes, pois, ao reduzir o tempo e custo de produção de um produto, as organizações têm a possibilidade de reduzir o seu preço. Apesar de se tratar de um problema global, este documento apenas se foca nas linhas de produção da Bosch, ao analisar uma grande quantidade de dados que foram disponibilizados para a criação de modelos de machine learning, com o objetivo de prever que componentes irão falhar ao longo do processo, por forma a melhorar o controlo de qualidade nas suas fábricas. Contudo, devido ao elevado número de entradas, estes dados têm que passar por várias etapas, para garantir que se encontram no melhor estado possível para serem testados e treinados pelos algoritmos. Estas etapas englobam o pré-processamento, ou seja, a correção de dados em falta, normalização, redução do tamanho do dataset, entre outras, e a Seleção de Características dos dados, ao selecionar apenas os atributos mais relevantes para a construção do modelo. Para o problema abordado neste documento, optou-se pela utilização da técnica de aprendizagem supervisionada, pelo facto do dataset utilizado ser rotulado, pois cada coluna contém um descritivo da peça, estação e linha de produção. Após terem sido analisados vários artigos semelhantes na mesma área de estudo, e terem sido comparados os seus resultados, os algoritmos XGBoost, Random Forest e Support Vector Machine foram escolhidos como os algoritmos a utilizar no desenvolvimento do modelo. Várias métricas de avaliação foram referidas na literatura como aptas para avaliar o modelo, como é o caso da exatidão, da precisão, da métrica F1, entre outras, que foram utilizadas para esse fim. Por fim, concluiu-se que o XGBoost foi o algoritmo que apresentou os melhores resultados no contexto deste estudo. O algoritmo SVM foi o mais rápido a efetuar as previsões e o algoritmo Random Forest é um meio termo entre velocidade e qualidade dos resultados. O melhor a aplicar nas linhas de produção da Bosch irá depender de que métrica é vista como tendo um maior peso para a organização. |
| publishDate |
2021 |
| dc.date.none.fl_str_mv |
2021-08-31T10:02:59Z 2021 2021-01-01T00:00:00Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.22/18266 urn:tid:202758826 |
| url |
http://hdl.handle.net/10400.22/18266 |
| identifier_str_mv |
urn:tid:202758826 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia instacron:RCAAP |
| instname_str |
FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
| instacron_str |
RCAAP |
| institution |
RCAAP |
| reponame_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| collection |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| repository.name.fl_str_mv |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
| repository.mail.fl_str_mv |
info@rcaap.pt |
| _version_ |
1833600806713032704 |