Back to Search Start Over

Outsourcing Computation on Non-Encrypted SensitiveData to Untrusted Clouds

Authors :
Ricci, Sara
Departament d'Enginyeria Informàtica i Matemàtiques
Universitat Rovira i Virgili.
Domingo-Ferrer, Josep
Soria Comas, Jorge
Universitat Rovira i Virgili. Departament d'Enginyeria Informàtica i Matemàtiques
Source :
TDX (Tesis Doctorals en Xarxa), Repositori Institucional de la Universitat Rovira i Virgili, Universitat Rovira i virgili (URV), TDR. Tesis Doctorales en Red, instname
Publication Year :
2018
Publisher :
Universitat Rovira i Virgili, 2018.

Abstract

L’emmagatzematge i el processat de grans dades en entorns locals presenta certs inconvenients, però l’ús del núvol per emmagatzemar i processar les dades pot donar lloc a problemes de privadesa i seguretat. En aquesta tesi tractem la problemàtica associada a l’ús de núvols no confiables. En particular, volem que el núvol pugui fer dos operacions amb dades sensibles no xifrades de manera pràctica i que preservi la privadesa: productes escalars i productes de matrius. Aquestes operacions són útils per fer diferents tipus d’anàlisis de dades com ara el càlcul de correlacions entre atributs i el càlcul de taules de contingència. Els nostres protocols ens permeten usar el núvol no només per emmagatzemar dades sensibles no xifrades sinó també per processar-les. Les avaluacions experimentals amb dades categòriques fetes sobre el serveis de núvol d’Amazon mostren que, amb els nostres protocols, l’administrador de les dades pot reduir el temps d’execució de les computacions més exigents en més del 99.999%. També presentem una metodologia per comparar mètodes de control estadstic de la revelació (SDC, l’acrònim anglès) per microdades en termes del equilibri entre risc i utilitat resultant. Els estudis comparatius anteriors comencen habitualment per seleccionar alguns valors dels paràmetres per un conjunt de mètodes SDC i avaluen el risc de revelació i la pèrdua d’informació que produeixen aquests paràmetres. Aqu comencem per seleccionar un nivell de risc i busquem els valors dels paràmetres necessaris per obtenir aquest nivell de risc amb cadascun dels mètodes SDC s’avaluen. Finalment, avaluem la utilitat, cosa que permet ordenar els mètodes d’acord a la utilitat. El almacenamiento i el procesado de grandes datos en entornos local presenta algunos inconvenientes, pero el uso de la nube para almacenar i procesar estos datos puede dar lugar a problemas de privacidad i de seguridad. En esta tesis tratamos la problemática asociada a el uso de nubes no confiables. En particular, queremos que la nube pueda hacer dos operaciones con datos sensibles no cifrados de forma práctica i que preserve la privacidad: productos escalares i productos de matrices. Nuestros protocolos nos permiten usar la nube no solo para almacenar datos sensibles no cifrados sino también para procesarlos. Las evaluaciones experimentales con datos categóricos que se han realizado sobre los servicios de nube de Amazon muestran que, con nuestros protocolos, el administrador de los datos puede reducir el tiempo de ejecución de las computaciones más exigentes en más del 99.999%. También presentamos una metodologa para comparar métodos de control estadstico de la revelación (SDC, acrónimo inglés) para microdatos en términos del equilibrio entre riesgo y utilidad que resulta. Los estudios comparativos anteriores empiezan habitualmente por seleccionar algunos valores de los parámetros para un conjunto de métodos SDC i evalúan el riesgo de revelación i perdida de información que producen estos parámetros. Aqu comenzamos por seleccionar un nivel de riesgo i buscamos los valores de los parámetros necesarios para obtener dicho nivel de riesgo con cada uno de los métodos SDC que se evalúan. Finalmente, una vez ja hemos conseguido un nivel de riesgo equivalente en los diferentes métodos SDC, evaluamos la utilidad, cosa que permite ordenar los métodos con respecto a la utilidad. Storing and processing big data in local premises is increasingly inconvenient, but resorting to cloud storage and processing raises security and privacy issues. We tackle here the problem of outsourcing to untrusted clouds in a practical and privacy-preserving manner two basic operations on non-encrypted sensitive data: scalar products and matrix products. These operations are useful to perform data analyses such as correlations between attributes or contingency tables, among others. Our protocols allow using the cloud not only to store sensitive non-encrypted data, but also to process them. In addition to analyzing the security of the proposed protocols, we also evaluate their performance against a baseline consisting of downloading plus local computation. The experiments on categorical data that we report on the Amazon cloud service show that, with our protocols, the data controller can save more than 99.999% runtime for the most demanding computations. We also present here a methodology to compare statistical disclosure control (SDC) methods for microdata in terms of how they perform regarding the risk-utility trade-off. Previous comparative studies usually start by selecting some parameter values for a set of SDC methods and evaluate the disclosure risk and the information loss yielded by the methods for those parameterizations. In contrast, here we start by setting a certain risk level and then we find which parameter values are needed to attain that risk under different SDC methods. Finally, we evaluate the utility provided by each method, in order to rank methods according to their utility preservation.

Details

Database :
OpenAIRE
Journal :
TDX (Tesis Doctorals en Xarxa), Repositori Institucional de la Universitat Rovira i Virgili, Universitat Rovira i virgili (URV), TDR. Tesis Doctorales en Red, instname
Accession number :
edsair.dedup.wf.001..2b7af058c7c9e8101253dee56503c9f3