125 results on '"Regroupement"'
Search Results
2. The pieces of the smallholder puzzle: The add‐in role of farmers' characteristics in irrigation improvement projects in the old lands of Egypt.
- Author
-
Salman, Maher, Fertő, Imre, Pék, Éva, El‐Desouky, Ibrahim Abd Al‐Latif, Zaki, Saad, Darwesh, Reda, Lebdi, Fethi, and Alali, Qotada
- Subjects
IRRIGATION ,IRRIGATION management ,LAND tenure ,WATER shortages ,FOOD security ,IRRIGATION water ,WATER security - Abstract
Copyright of Irrigation & Drainage is the property of Wiley-Blackwell and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2022
- Full Text
- View/download PDF
3. Classification and clustering of buildings for understanding urban dynamics: A framework for processing spatiotemporal data.
- Author
-
Joan, Perez, Giovanni, Fusco, and Sadahiro Yukio
- Subjects
- *
SPATIOTEMPORAL processes , *ELECTRONIC data processing , *STRUCTURAL dynamics , *CLASSIFICATION , *SELF-organizing maps - Abstract
This paper presents different methods implemented with the aim of studying urban dynamics at the building level. Building types are identified within a comprehensive vector-based building inventory, spanning over at least two time points. First, basic morphometric indicators are computed for each building: area, floor-area, number of neighbors, elongation, and convexity. Based on the availability of expert knowledge, different types of classification and clustering are performed: supervised tree-like classificatory model, expert-constrained k-means and combined SOM-HCA. A grid is superimposed on the test region of Osaka (Japan) and the number of building types per cell and for each period is computed, as well as the differences between each period. Mappings are then performed, showing that building types have specific locations and dynamics. In some extreme cases, a specific building type can even gradually replace a type on a declining dynamic. Questions of data preparation, and clustering validation are also dealt with, underlining the interest of assessing the spatial distribution of clusters. [ABSTRACT FROM AUTHOR]
- Published
- 2022
- Full Text
- View/download PDF
4. ¿Difiere la dinámica de enseñanza de las escuelas rurales del norte y sur de España? Propensión, contrastes y similitudes.
- Author
-
García Prieto, Francisco Javier, Álvarez-Álvarez, Carmen, and Pozuelos Estrada, Francisco José
- Subjects
- *
RURAL schools , *URBAN schools , *CURRICULUM planning , *TEACHING aids , *TEXTBOOKS , *TEACHER development - Abstract
Rural schools take different forms in each country and develop common and divergent teaching practices in comparison to urban schools. In Spain we have different types of schools and this constitutes a complex reality. However, we hardly have comparative studies between regions that show the peculiarities of the different types of schools available. In this article, which adopts a quantitative (questionnaire) and qualitative (in-depth interviews) design, we analyse the similarities and differences that exist between the dynamics of teaching in rural schools in the north (Cantabria) and in the south of Spain (Huelva). The results compare four variables (environment, schools, teachers, students and families) in three types of schools (teaching practice, curriculum development, teaching materials and attention to diversity). The conclusions show contrasts with regard to innovation, attention to diversity or teaching staff; and similarities in curricular aspects such as the tendency to use textbooks or the dynamics of teaching within the different types of rural schools. [ABSTRACT FROM AUTHOR]
- Published
- 2021
- Full Text
- View/download PDF
5. Evaluation and innovation: An antagonistic pair?
- Author
-
D'Agostino, Fred and Malpas, Jeffery
- Abstract
Copyright of Social Science Information is the property of Sage Publications, Ltd. and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2021
- Full Text
- View/download PDF
6. A systematic heat recovery approach for designing integrated heating, cooling, and ventilation systems for greenhouses
- Author
-
Sorin, Mikhail, Ghaderi Zefreh, Mohsen, Sorin, Mikhail, and Ghaderi Zefreh, Mohsen
- Abstract
Heat recovery plays a pivotal role in enhancing energy efficiency and reducing operating costs in the energy sector. In the context of greenhouse energy management, heat recovery measures hold significant potential to improve overall efficiency and profitability while improving sustainability. By specifically targeting ventilation waste heat, it is aimed to identify efficient and innovative ways to harness this abundant but often overlooked energy source. The primary objective of this thesis is to present a systematic methodology that offers practical insights into the design of a heat recovery system for greenhouses using heat integration technique. Considering the dynamic nature of greenhouse processes, dynamic Pinch Analysis (PA) is applied for the very first time to design an integrated greenhouse heating, cooling, and ventilation system. So, in the first step, the greenhouse climate conditioning system is defined in terms of distinct streams representing different components and processes within the system. This stream-based representation allows for a comprehensive understanding of the system's thermal dynamics, facilitating heat recovery analysis. Then, the required data to fully define all streams as a function of time (i.e. thermal and ventilation requirements) are calculated using a greenhouse climate model developed in Matlab/Simulink. Dynamic PA is accomplished in two major steps: energy targeting and heat exchanger network design. By employing energy targeting techniques based on graphical PA (composite curves), the methodology identifies heat recovery opportunities and determines the integration possibilities within the greenhouse. In the next step, a heuristic approach is presented to allocate a suitable heat exchanger network to the streams, thereby achieving the set energy targets. In this approach, the HEN design problem is solved only for the most representative time periods (i.e. typical days) determined using clustering. This can cons, La récupération de chaleur joue un rôle crucial dans l'amélioration de l'efficacité énergétique et la réduction des coûts opérationnels dans le secteur de l'énergie. Dans le contexte de la gestion de l'énergie des serres, les mesures de récupération de chaleur offrent un potentiel significatif pour améliorer l'efficacité globale et la rentabilité tout en favorisant la durabilité. En ciblant spécifiquement la chaleur perdue par la ventilation, notre objectif est d'identifier des moyens efficaces et innovants pour exploiter cette source d'énergie abondante mais souvent négligée. Cette thèse a pour principal objectif de présenter une méthodologie systématique offrant des aperçus pratiques sur la conception d'un système de récupération de chaleur pour les serres en utilisant la technique d'intégration thermique. Compte tenu de la nature dynamique des processus des serres, l'Analyse Pinch dynamique (PA) est appliquée pour la toute première fois afin de concevoir un système de chauffage, de refroidissement et de ventilation intégré pour les serres. Ainsi, dans un premier temps, le système de conditionnement du climat des serres est défini en termes de flux distincts représentant les différents composants et processus au sein du système. Cette représentation basée sur les flux permet de comprendre de manière exhaustive la dynamique thermique du système, facilitant ainsi l'analyse de récupération de chaleur. Ensuite, les données requises pour définir entièrement tous les flux en fonction du temps (c'est-à-dire les besoins thermiques et de ventilation) sont calculées à l'aide d'un modèle climatique de serre développé dans Matlab/Simulink. L'Analyse Pinch dynamique est réalisée en deux étapes majeures: le ciblage énergétique et la conception du réseau d'échangeurs de chaleur. En utilisant des techniques de ciblage énergétique basées sur l'Analyse Pinch graphique (courbes composites), la méthodologie identifie les opportunités de récupération de chaleur et détermine les possib
- Published
- 2023
7. Land use diversity around metro stations in São Paulo
- Author
-
André De Freitas Gonçalves
- Subjects
utilisation des sols urbains ,uso do solo urbano ,clusterização ,índice de entropia ,General Medicine ,estação de metrô ,regroupement ,station de métro ,indice d'entropie ,São Paulo - Abstract
O adensamento urbano no entorno das estações de metrô tem sido utilizado como meio de alcançar a redução da distância e tempo de viagens, promoção do transporte ativo e coletivo. Utilizamos o indicador de diversidade do uso do solo como forma de caracterizar o entorno das estações de metrô da cidade de São Paulo, apontando para homogeneidade ou heterogeneidade do uso do espaço urbano. De forma complementar, identificamos os usos predominantes por meio da clusterização. A combinação das duas técnicas evidencia a amplitude da diversidade do uso do solo e seu relacionamento com os grupos predominantes. La densification urbaine autour des stations de métro a été utilisée comme un moyen de réduire la distance et la durée des déplacements et de promouvoir le transport actif et collectif. Nous avons utilisé l'indicateur de diversité de l'utilisation des sols comme moyen de caractériser les environs des stations de métro dans la ville de São Paulo, en indiquant l'homogénéité ou l'hétérogénéité de l'utilisation de l'espace urbain. De manière complémentaire, nous identifions les usages prédominants par le biais de clusters. La combinaison des deux techniques met en évidence l'amplitude de la diversité de l'utilisation des sols et sa relation avec les clusters prédominants. Urban densification around metro stations has been used as a means to achieve the reduction of travel distance and time, promotion of active and collective transportation. We used the land use diversity indicator as a way to characterize the surroundings of metro stations in the city of São Paulo, pointing to homogeneity or heterogeneity of urban space use. In a complementary manner, we identify the predominant uses by means of clustering. The combination of both techniques evidences the amplitude of land use diversity and its relationship with the predominant clusters.
- Published
- 2022
8. Desempenho da produção agropecuária dos municípios pertencentes ao Escritório de Desenvolvimento Rural de Andradina, SP, Brasil.
- Author
-
Bonfim de Carvalho, Jaqueline, Rodrigo Panosso, Alan, Sabbag, Omar Jorge, and Aparecida Anselmo Tarsitano, Maria
- Abstract
The assignment of the Rural Development Offices (EDR) is execution of activities related to regional plans and municipal rural development. The objective of work was to analyze the agricultural efficiency thirteen municipalities belonging to EDR of Andradina/SP, by multivariate statistics and data envelopment analysis (DEA). The analyzes allowed conclude that most units working inefficiently, with Valparaíso and Bento de Abreu highlight municipalities. [ABSTRACT FROM AUTHOR]
- Published
- 2017
- Full Text
- View/download PDF
9. Social cues may advertise habitat quality to refuge-seeking conspecifics.
- Author
-
Elvidge, C.K., Cooke, E.L.L., Cunjak, R.A., and Cooke, S.J.
- Subjects
- *
ATLANTIC salmon behavior , *HABITATS , *TERRITORIAL behavior in fishes , *FISH behavior , *FISH schooling - Abstract
Individuals travelling through landscapes may use the presence of conspecifics to evaluate habitat quality. Juvenile Atlantic salmon ( Salmo salar L., 1758) are usually territorial and exhibit some degree of density-dependent regulation in wild populations. They are also vulnerable to heat stress and may need to locate a thermal refuge to offset metabolic costs above certain temperature thresholds. During July 2010, a heat wave resulted in water temperatures in the Miramichi River system exceeding 30 °C. During this period, salmon parr were observed aggregating in cold-water refugia at densities several orders of magnitude greater than usual. We tested whether groups of wild-caught salmon parr held at high densities (160 parr/m2) would have an attractant effect on free-swimming parr at three sites differing in temperature between 16.5 and 24 °C. Although neither temperature nor site influenced the number of parr that we observed, there were significantly more parr in close proximity (<1 m) to the artificial aggregations than to the controls. These results suggest that social cues from high-density aggregations of conspecifics during extreme temperature events may advertise the location of thermal refugia to others. Understanding how heat-stressed salmon locate refugia may prove valuable to ongoing conservation efforts given the likelihood of increasingly frequent and extreme high-temperature events. [ABSTRACT FROM AUTHOR]
- Published
- 2017
- Full Text
- View/download PDF
10. Analyse exploratoire et classification de textes
- Author
-
Florian Barbaro and Barbaro, Florian
- Subjects
[INFO.INFO-AI] Computer Science [cs]/Artificial Intelligence [cs.AI] ,model selection ,analyse exploratoire de textes ,données de grande dimension ,finance ,high dimensional data ,pénalisation l 1 ,[INFO.INFO-DS] Computer Science [cs]/Data Structures and Algorithms [cs.DS] ,regroupement ,NLP ,classification ,l 1 penalization ,exploratory text analysis ,mélanges de lois de von Mises-Fisher ,sélection de modèles ,[MATH.MATH-ST] Mathematics [math]/Statistics [math.ST] ,mixtures distribution of von Mises-Fisher ,clustering - Abstract
In recent years, Natural Language Processing (NLP) has become very popular withthe scientific community and also with industry because of the numerous opportunitiesit offers. Indeed, nowadays we are submerged by information and this raises the questionof its analysis. This is the direction we have taken in our thesis, namely how to makethe result of a classification easily analysable and understandable.Chapter 1 provides a contextualisation of the thesis and its interest. In addition, wepresent its structure and a synthetic summary of the thesis’ work.Chapter 2 is here to recall the state of the art of text representation methods, someadapted modelling methods, as well as models for directional data.Then comes Chapter 3, which presents the data that has followed us throughout thethesis. This dataset, which we built, is freely available, contains the 8-K reports of theS&P 500 companies for 2015 to 2019.In Chapter 4, inspired by some papers that worked on 8-K, we try to predict themovement of a financial asset according to the publication of an 8-K report. Differenttechniques are tried, both for text representation and classification, and we show in ourcase that increasing the complexity of the models does not necessarily improve the results.Chapter 5 follows on from the previous chapter, in which we focus on the compari-son of text representations for exploratory analysis using a classification algorithm. Ouraim here is to analyse several text representations and to propose new ways of visualisation for an easier understanding of classification.To continue in this direction, in Chapter 6, we propose a mixture model of vonMises-Fisher distribution penalized by the l 1 norm. This leads to sparse prototypes thatimprove clustering interpretability. We derive an EM algorithm for this model and illustrate the interest of our approach on a real data set. Moreover, we propose a path-following method that allows, in adequacy with model selection criteria, to automatically select the penalization parameter., Le traitement automatique des langues (NLP) a connu ces dernières années un grandengouement auprès de la communauté scientifique mais aussi des industriels pour lesnombreuses opportunités offertes. En effet, nous sommes, de nos jours, submergés parles informations et par les différentes façons de les analyser. C’est dans cette voie quenous avons orienté notre thèse, à savoir comment rendre le résultat d’une classificationfacilement analysable et compréhensible.Le Chapitre 1 permettra une contextualisation de la thèse et de son intérêt tout eny présentant sa structure. De plus, un résumé synthétique des travaux de la thèse y estprésenté.Le Chapitre 2 présentera l’état de l’art des modèles de représentation de textes uti-lisés, quelques méthodes de modélisations adaptées ainsi que des modèles pour les don-nées directionnelles.Puis, le Chapitre 3 présentera les données qui nous ont accompagné tout au longde la thèse. Ce jeu de données, que nous avons constitué et qui est disponible librement,contient les rapports 8-K des entreprises du S&P 500 pour les années 2015 à 2019.Dans le Chapitre 4, en nous inspirant de certains articles traitant des 8-K, nousessayerons de prédire le mouvement d’un actif financier selon la publication d’un rapport8-K. Différentes techniques sont testées, tant pour la représentation de textes que pourla classification, et nous démontrerons que la complexification des modèles n’amélioreque très légèrement les résultats de ladite classification.Ensuite, dans le Chapitre 5, nous nous concentrerons sur la comparaison de représentations de textes en vue d’une analyse exploratoire à l’aide d’un algorithme declassification. Notre but est d’analyser plusieurs représentations de textes et de proposerde nouvelles manières de visualiser pour mieux appréhender la classification.De même, dans le Chapitre 6, nous proposerons un modèle de mélange de distribution de von Mises-Fisher pénalisé par la norme l 1 . Ceci permet d’améliorer l’interprétabilité des clusters obtenus grâce notamment à la parcimonie des moyennes directionnelles.Nous dériverons un algorithme EM pour ce modèle et nous illustrerons l’intérêt de notreapproche sur plusieurs jeux de données réelles. De plus, nous proposerons une méthodede suivi de chemin qui permet en adéquation de critères de sélection de modèles, desélectionner automatiquement le paramètre de pénalisation.
- Published
- 2022
11. Le regroupement familial en Italie. Une législation de plus en plus restrictive qui s’inscrit dans un contexte plus général de fermeture des frontières européennes
- Author
-
Caroline Savi
- Subjects
famille ,immigration ,regroupement ,Language and Literature ,French literature - Italian literature - Spanish literature - Portuguese literature ,PQ1-3999 - Abstract
Le regroupement familial est aujourd’hui l’une des seules façons d’immigrer légalement en Europe et il représente l’une des principales sources d’immigration dans la plupart des États européens. En Italie, le droit au regroupement familial est régi par l’article 29 du Texte unique sur l’immigration de 1998 qui est toujours en vigueur, même s’il a été modifié à de nombreuses reprises. L’analyse des différentes réformes montre que l’Italie a progressivement durci et compliqué les règles du regroupement familial, considéré comme une immigration “subie”, et qu’elle a fait le choix comme d’autres pays européens de faire primer les considérations économiques sur les droits fondamentaux.
- Published
- 2010
- Full Text
- View/download PDF
12. Decreasing child mortality, spatial clustering and decreasing disparity in North-Western Burkina Faso.
- Author
-
Becher, Heiko, Müller, Olaf, Dambach, Peter, Gabrysch, Sabine, Niamba, Louis, Sankoh, Osman, Simboro, Seraphin, Schoeps, Anja, Stieglbauer, Gabriele, Yé, Yazoume, and Sié, Ali
- Subjects
- *
CHILD mortality statistics , *SPATIAL variation , *REGRESSION analysis - Abstract
Within relatively small areas, there exist high spatial variations of mortality between villages. In rural Burkina Faso, with data from 1993 to 1998, clusters of particularly high child mortality were identified in the population of the Nouna Health and Demographic Surveillance System (HDSS), a member of the INDEPTH Network. In this paper, we report child mortality with respect to temporal trends, spatial clustering and disparity in this HDSS from 1993 to 2012. Poisson regression was used to describe village-specific child mortality rates and time trends in mortality. The spatial scan statistic was used to identify villages or village clusters with higher child mortality. Clustering of mortality in the area is still present, but not as strong as before. The disparity of child mortality between villages has decreased. The decrease occurred in the context of an overall halving of child mortality in the rural area of Nouna HDSS between 1993 and 2012. Extrapolated to the Millennium Development Goals target period 1990-2015, this yields an estimated reduction of 54%, which is not too far off the aim of a two-thirds reduction. [ABSTRACT FROM AUTHOR]
- Published
- 2016
- Full Text
- View/download PDF
13. Réalisation d’un outil de simulation visant l’amélioration de la perception de la scène dans un autobus/véhicule autonome.
- Author
-
Gingras, Denis, Cabrera Tamayo, William, Gingras, Denis, and Cabrera Tamayo, William
- Abstract
Les véhicules intelligents constituent une technologie qui a évolué de façon notable au cours des dernières années. Concevoir un véhicule pleinement autonome signifie que ce véhicule n’aura pas besoin de l’aide de l’humain pour le conduire. Ceci n’est pas une tâche facile pour une machine qui n’a pas la capacité de raisonner en temps réel comme un humain. Pour atteindre ce but, il y a certains problèmes qu’il faut résoudre tout en minimisant le niveau de risque de collision afin d’apporter une réduction significative des accidents routiers. Mon travail propose une architecture qui vise la détection d'obstacles dans l’environnement immédiat de l’égo-véhicule. À partir d’images et de données LiDAR fournies par des capteurs tels qu’un LiDAR et une caméra vidéo, je procède à la détection et à l'estimation de la distance de ces objets en fusionnant l’ensemble des données. Dans une première étape, je travaille sur l'acquisition et le prétraitement de données en utilisant des banques de données telles que KITTI Datasets et Google WAYMO dont je parlerai plus tard dans le document. Par ailleurs, le simulateur CARLA sera utilisé pour la validation de notre architecture. Dans une deuxième étape, je travaille sur l’intelligence artificielle embarquée pour le développement et la simulation des fonctions de perception et de prise de décision à bord d’un autobus autonome, dans le cadre d’un projet de recherche conjoint avec la firme québécoise Novabus-Volvo. Ceci impliquera certaines techniques de l’apprentissage machine telles que des réseaux de neurones à convolution et des algorithmes de clustering, notamment pour améliorer la précision de l’estimation de la distance des objets dans le voisinage de l’égo-véhicule. Dans cette étape, je propose l'utilisation d'une architecture de réseaux de neurones profonds qui fait une segmentation par instance dans le but d'assigner les pixels de l'image correspondant à chaque objet détecté. Par la suite, l'algorithme de clustering hiérarchiqu, The autonomous vehicle is a technology that has evolved significantly in recent years. Making a vehicle truly autonomous means that this vehicle will not need human assistance to make decisions in any situation, which is not an easy task for a machine since they have no reasoning abilities. To do this, there are problems that need to be addressed to get to the point of full autonomy with the lowest possible level of risk and therefore a significant reduction in road accidents. My work proposes an architecture to perform object detection from images and distance estimation of these objects by merging data provided by sensors such as LiDAR and the camera. In a first step, I work on the acquisition and the preprocessing of data using databases such as KITTI Datasets and Google WAYMO which we will discuss later in the document. The CARLA simulator will be another source of data that will be used for the validation of our architecture. In a second step, I work in on-board artificial intelligence for the development and simulation of perception and decision-making functions in an autonomous bus. Here will see some machine learning techniques such as convolutional neural networks and clustering algorithms to improve the accuracy of distance estimation. With these techniques we first assign to each detected object its corresponding pixels in the image by using a deep neural network architecture which makes an instance segmentation. Afterwards, the hierarchical clustering algorithm will be applied to the LiDAR 3D points corresponding to the pixels of the detected objects. This will allow the system to better estimate the distance. Finally, we implement the tool that will simulate the two previous steps. This implementation was made based on CARLA simulator and the KITTI and Google WAYMO databases. This tool gives the possibility of being integrated with other simulators in the future if needed.
- Published
- 2021
14. Informal Workers' Aggregation in India : An Evolving Model of Collective Action.
- Author
-
ROUTH, SUPRIYA
- Published
- 2015
- Full Text
- View/download PDF
15. New Partition-based and Density-based approaches for improving clustering
- Author
-
El Malki, Nabil, Systèmes d’Informations Généralisées (IRIT-SIG), Institut de recherche en informatique de Toulouse (IRIT), Université Toulouse 1 Capitole (UT1), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3), Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse 1 Capitole (UT1), Université Fédérale Toulouse Midi-Pyrénées, Université Toulouse - Jean Jaurès, Olivier Teste, and Franck Ravat
- Subjects
Partition-based clustering ,Regroupement ,Calculation time acceleration ,Accélération du temps de calcul ,Regroupement basé sur la densité ,[INFO]Computer Science [cs] ,Regroupement basé sur les centroides ,Clustering ,Density-based clustering - Abstract
Clustering is a branch of machine learning consisting in dividing a dataset into several groups, called clusters. Each cluster contains data with similar characteristics. Several clustering approaches exist that differ in complexity and efficiency due to the multitude of clustering applications. In this thesis, we are mainly interested in centroid-based methods, more specifically k-means and density-based methods. In each approach, we have made contributions that address different problems.Due to the growth of the amount of data produced by different sources (sensors,social networks, information systems...), it is necessary to design fast algorithms to manage this growth. One of the best-known problems in clustering is the k-means problem. It is considered NP-hard in the number of points and clusters. Lloyd’sheuristic has approximated the solution to this problem. This is one of the ten most used methods in data mining because of its algorithmic simplicity. Nevertheless, this iterative heuristic does not propose an optimization strategy that avoids repetitive calculations. Versions based on geometric reasoning have partially addressed this problem. In this manuscript, we proposed a strategy to reduce unnecessary compu-tations in Lloyd’s version and the versions based on geometric reasoning. It consists mainly in identifying, by estimation, the stable points, i.e., they no longer contribute to improving the solution during the iterative process of k-means. Thus, calculations related to stable points are avoided.K-means requires a priori, from users, the value of the number of K clusters. It is necessary for K to be the closest to the ground truth. Otherwise, the result of partitioning is of low quality or even unusable. We proposed Kd-means, an algorithm based on a hierarchical approach. It consists in hierarchizing data in a Kd-tree data structure and then merging sub-groups of points recursively in the bottom-up direction using new inter-group merging criteria that we have developed. These criteria guide the merging process to estimate K closest to real and produce clusters with a more complex shape than sphericity. Through experimentation, Kd-means has clearly shown its superiority over its competitors in execution time, clustering quality and K estimation. The density-based approach’s challenges are the high dimensionality of the points,the difficulty to separate low-density clusters from groups of outliers, and the sep-aration of close clusters of the same density. To address these challenges, we have developed DECWA, a method based on a probabilistic approach. In DECWA, we proposed 1) a strategy of dividing a dataset into sub-groups where each of them follows its probability law; 2) followed by another strategy that merges subgroups, similar in probability law, into final clusters. Experimentally, DECWA, in high-dimensional spaces, produces a good quality clustering compared to its competitors; Le clustering est une branche de l’apprentissage automatique consistant à diviser un ensemble de données en plusieurs groupes appelés clusters. Chacun des clusterscontient des données avec des caractéristiques similaires. Plusieurs approches de clus-tering existent qui diffèrent en complexité et en efficacité, en raison de la multitude d’applications du clustering.Dans cette thèse, nous nous intéressons essentiellement aux méthodes basées sur les centroïdes plus spécifiquement les k-moyennes et aux méthodes basées sur la densité.Dans chaque approche, nous avons apporté des contributions qui répondent à des problèmes différents.En raison de la croissance de la quantité de données produite par différentes sources(capteurs, réseaux sociaux, systèmes d’information. . . ), il est nécessaire de concevoir des algorithmes rapides pour gérer cette croissance. L’un des problèmes les plus connus en clustering est celui des k-moyennes. Il est considéré NP-difficile en nombre de points et de clusters. La solution de ce problème a été approximée par l’heuristique de Lloyd.Celle-ci est l’une des dix méthodes les plus utilisées en fouille de données en raison de sa simplicité algorithmique. Néanmoins, cette heuristique itérative ne propose pas de stratégie d’optimisation qui évite des calculs répétitifs. Des versions basées sur le raisonnement géométrique ont répondu en partie à ce problème. Dans ce manuscrit,nous avons proposé une stratégie visant à réduire les calculs inutiles dans la version de Lloyd ainsi que dans les versions basées sur le raisonnement géométrique. Elle consiste principalement à identifier, par estimation, les points qui sont stables, c’est-à-dire, qui ne contribuent plus à l’amélioration de la solution lors du processus itératif de k-moyennes. Ainsi, les calculs liés aux points stables sont évités.K-moyennes requiert a priori, de la part des utilisateurs, la valeur du nombre de clusters K. Il est nécessaire que K soit la plus proche de la vérité-terrain, sinon le résultat de partitionnement est de mauvaise qualité voire inutilisable. Nous avons proposé Kd-means, un algorithme basé sur une approche hiérarchique. Elle consiste à hiérarchiser les données dans une structure de données du type Kd-tree puis à fusionner des sous-groupes de points récursivement dans le sens bas-haut via de nouveaux critères de fusion inter-groupes que nous avons développé. Ces critères guident le processus de fusion à estimer K le plus proche du réel et de produire des clusters ayant une forme plus complexe que la sphéricité. À travers les expérimentations, Kd-means a nettement montré sa supériorité, face à ses concurrents, en temps d’exécution, en qualité de clustering et en estimation de K.Les défis de l’approche des méthodes basées sur la densité sont la grande dimen-sionnalité des points, la difficulté à séparer les clusters de faible densité des groupes de points aberrants ainsi que la séparation des clusters proches de même densité. Pour y répondre, nous avons développé DECWA, une méthode basée sur une approche probabiliste. Dans DECWA, nous avons proposé 1) une stratégie de division d’un ensemble de données en sous-groupes où chacun d’eux suit sa loi de probabilité ; 2) suivie d’une autre stratégie qui fusionne des sous-groupes, similaires en loi de probabilité, en clus-ters finaux. Expérimentalement, DECWA, dans des espaces de grandes dimensions,produit un clustering de qualité par rapport à ses concurrents.
- Published
- 2021
16. Nouvelles approches basées sur la partition et la densité pour l’amélioration du clustering
- Author
-
El Malki, Nabil, STAR, ABES, Systèmes d’Informations Généralisées (IRIT-SIG), Institut de recherche en informatique de Toulouse (IRIT), Université Toulouse 1 Capitole (UT1), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3), Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse 1 Capitole (UT1), Université Fédérale Toulouse Midi-Pyrénées, Université Toulouse - Jean Jaurès, Olivier Teste, and Franck Ravat
- Subjects
Unsupervised classification ,Optimisation du temps de calcul ,Classification non supervisée ,Clustering ,Density-based clustering ,[INFO.INFO-OH] Computer Science [cs]/Other [cs.OH] ,Computing time optimization ,Partition-based clustering ,Regroupement ,Calculation time acceleration ,Accélération du temps de calcul ,Regroupement basé sur la densité ,[INFO]Computer Science [cs] ,Regroupement basé sur les centroides ,K-means ,K-moyennes - Abstract
Clustering is a branch of machine learning consisting in dividing a dataset into several groups, called clusters. Each cluster contains data with similar characteristics. Several clustering approaches exist that differ in complexity and efficiency due to the multitude of clustering applications. In this thesis, we are mainly interested in centroid-based methods, more specifically k-means and density-based methods. In each approach, we have made contributions that address different problems., Le clustering est une branche de l’apprentissage automatique consistant à diviser un ensemble de données en plusieurs groupes appelés clusters. Chacun des clusters contient des données avec des caractéristiques similaires. Plusieurs approches de clustering existent qui diffèrent en complexité et en efficacité, en raison de la multitude d’applications du clustering. Dans cette thèse, nous nous intéressons essentiellement aux méthodes basées sur les centroïdes plus spécifiquement les k-moyennes et aux méthodes basées sur la densité. Dans chaque approche, nous avons apporté des contributions qui répondent à des problèmes différents.
- Published
- 2021
17. Approche de codage canal et de regroupement efficace en consommation énergétique et évolutif en taille de réseaux pour l'internet des objets à bande étroite (NB-IoT)
- Author
-
Migabo, Munguakonkwa Emmanuel, STAR, ABES, Laboratoire Images, Signaux et Systèmes Intelligents (LISSI), Université Paris-Est Créteil Val-de-Marne - Paris 12 (UPEC UP12), Université Paris-Est, Tshwane University of Technology, Karim Djouani, and Anish Mathew Kurien
- Subjects
Évolutif ,Narrowband ,Spectre étalé ,Internet of Things ,Efficacité Energétique ,Internet des Objets ,Energy Efficient ,[INFO.INFO-MO]Computer Science [cs]/Modeling and Simulation ,Clustering ,Bande étroite ,Regroupement ,Spread Spectrum ,[INFO.INFO-MO] Computer Science [cs]/Modeling and Simulation ,Scalable - Abstract
The Narrowband-Internet of Things (NB-IoT) is one of the leading licensed Low Power Wide Area Networks (LPWANs) that is expected to play a very important role in connecting the exponentially increasing number of connected devices that make up the Internet of Things (IoT). To enable its network scalability, NB-IoT requires more efficient utilization of its limited energy, channel capacity, and spectrum network resources. These characteristics place various constraints in terms of the design of the physical (PHY) channel coding and spectrum access as well as the network layer protocol for the NB-IoT. A few existing channel coding approaches have been proposed to enhance the NB-IoT’s network reliability, and therefore, enable long-distance transmissions. However, most of the existing NB-IoT channel coding approaches are based on repeating transmission data and control signals and do not consider the channel conditions. Although these repetitions ensure network reliability, they are energy expensive and compromise the performance of the data rate of the network. At the same time, the increasing number of devices to be handled by a single Base Station (BS) within a cell increases the probability for interlink interference which compromises the uplink communication reliability, further increases the number of required data transmission repetitions, and therefore, reduces the overall energy efficiency of the network. To mitigate these identified problems, a multi-layer approach is proposed in this study. Firstly, a channel-aware two-dimensional Energy-Efficient Adaptive Channel Coding (EEACC) approach is considered at the PHY layer. The EEACC not only selects an appropriate modulation coding scheme (MCS) based on the estimated channel conditions (dynamically classified as bad, medium or good based on a periodically assessed BLER performance outcome) but also minimizes the transmission repetition number under a pre-assessed probability of successful transmission. Secondly, at the PHY and network layers, the study considers a two-layers NB-IoT mixed spread spectrum and clustering approach with network coding (N-MANC). At one layer, the approach uses an Adaptive Frequency Hopping Spread Spectrum (AFHSS) technique that uses a lightweight and secure pseudo-random sequence with a varying period T depending on the number of NB-IoT nodes in the considered cell to exploit the channel diversity as a way to mitigate inter-link and cross-technology interference. At the second layer, the mixed approach consists of a cooperative clustering approach based on a defined energy-signal strength gradient used for Cluster Head (CHs) selection, and a network coding (data aggregation) to further boost the overall energy efficiency of the network. A systematic mathematical model of the NB-IoT PHY layer is first developed and modelled. Then, the proposed algorithms are implemented and validated in MATLAB. The obtained simulation results demonstrate that the important QoS metrics such as energy efficiency, network reliability, data rate, transmission latency, network scalability, and lifetime are improved by the proposed algorithms when compared to existing approaches., L'Internet des objets à bande étroite (NB-IoT) est l'un des principaux réseaux étendus à basse consommation énergétique (LPWAN) dans la bande des fréquences sous licence d’utilisation, qui devrait jouer un rôle très important dans la connexion du nombre exponentiellement croissant d'objets connectés qui composent l'Internet des objets (IoT). Pour permettre l'évolutivité de son réseau, la NB-IoT nécessite une utilisation plus efficace de son énergie limitée, de la capacité de ses canaux et des ressources du spectre du réseau. Ces caractéristiques créent ainsi diverses contraintes en termes de conception du codage physique des canaux (PHY) et de l'accès au spectre ainsi que du protocole de la couche réseau pour l'Internet des objets. Quelques approches de codage de canal existantes ont été proposées pour améliorer la fiabilité du réseau de la NB-IoT et permettre ainsi les transmissions à longue distance. Cependant, la plupart des approches de codage de canal existantes de la NB-IoT sont basées sur la répétition des données de transmission et des signaux de contrôle et ne tiennent pas compte des conditions du canal. Bien que ces répétitions assurent la fiabilité du réseau, elles sont coûteuses en énergie et compromettent les performances du réseau en matière de débit de données. En même temps, le nombre croissant de dispositifs devant être traités par une seule station de base (BS) au sein d'une cellule augmente la probabilité d'interférences entre les liaisons, ce qui compromet la fiabilité de la communication sur la liaison montante, augmente encore le nombre requis de répétitions de transmission de données et, par conséquent, réduit l'efficacité énergétique globale du réseau. Pour pallier ces divers problèmes identifiés, une approche multicouche est proposée dans cette thèse. Tout d'abord, une approche bidimensionnelle de codage de canal adaptatif économe en énergie (EEACC) est proposée au niveau de la couche PHY. L'EEACC ne se contente pas de sélectionner un schéma de codage de modulation (MCS) approprié en fonction des conditions estimées du canal (classé dynamiquement comme mauvais, moyen ou bon sur la base d'un résultat de performance BLER évalué périodiquement), mais il minimise également le nombre de répétitions de transmission en fonction d'une probabilité préévaluée de réussite de la transmission. Deuxièmement, en ce qui concerne les couches PHY et réseau, l'étude développe une approche à deux couches NB-IoT `a étalement mixte du spectre et à regroupement avec codage du réseau (N-MANC). Sur une couche, l'approche utilise une technique d'étalement du spectre par saut de fréquence adaptative (AFHSS) qui utilise une séquence pseudo-aléatoire légère et sûre avec une période variable T selon le nombre de nœuds NB-IoT dans la cellule considérée pour exploiter la diversité des canaux comme moyen d'atténuer les interférences entre les liaisons et les technologies croisées. A la deuxième couche, l'approche mixte consiste en une approche de regroupement coopérative basée sur un gradient de force du signal énergétique défini utilisé pour la sélection des têtes de grappe (CHs), et un codage du réseau (agrégation de données) pour stimuler davantage l'efficacité énergétique globale du réseau. Un modèle mathématique systématique de la couche PHY du NB-IoT est d'abord développé et modélisé. Ensuite, les algorithmes proposés sont mis en œuvre et validés utilisant les simulations MATLAB. Les résultats de simulation obtenus montrent que les algorithmes proposés améliorent les paramètres importants de la qualité de service (QoS), tels que l'efficacité énergétique, la fiabilité du réseau, le débit de données, la latence de transmission, l'extensibilité du réseau et la durée de vie, par rapport aux approches existantes.
- Published
- 2021
18. Élèves doués et expérience scolaire : le point de vue d’élèves doués, en 2e cycle du secondaire, scolarisés en classe de douance
- Author
-
Rouaud, Émilie and Desbiens, Nadia
- Subjects
Haut potentiel ,Enrichissement ,Différentiation pédagogique ,Giftedness program ,Acceleration ,Giftedness ,High potential ,Programme douance ,Educational differentiation ,Douance ,Adaptation scolaire ,Special education ,Enrichment ,Regroupement ,Grouping ,Expérience scolaire ,School experience ,Accélération - Abstract
L’objectif principal de cette étude vise à documenter l’expérience scolaire et sociale d’élèves doués du secondaire, regroupés dans un programme « douance » du Québec. Les objectifs spécifiques sont de comprendre le point de vue des élèves en ce qui a trait à leur expérience académique et à leur expérience individuelle au sein de leur classe. Leur point de vue est donc au cœur de la démarche, afin de saisir leurs perceptions scolaires, sociales et individuelles des mesures pédagogiques dont ils bénéficient (regroupement, accélération, enrichissement). Pour ce faire nous nous sommes appuyés sur les modèles théoriques de la douance selon Renzulli et Gagné ainsi que sur les modèles théoriques de l’expérience scolaire selon Dubet et Rochex. Une approche qualitative qui s’appuie sur le récit de vie, l’entrevue semi-dirigée et l’entrevue de groupe a été privilégiée pour réunir et analyser les données issues des 12 participants. Nos résultats suggèrent que le programme douance est globalement apprécié par les élèves, notamment la dimension sociale du parcours scolaire. Les dimensions académiques et individuelles sont plus nuancées, notamment en raison de critiques concernant le manque d’accélération et le manque de différentiation pédagogique. Toutefois, il en résulte une expérience scolaire majoritairement positive pour ces élèves grâce au regroupement pendant l’ensemble de la scolarité du secondaire. Les résultats sont discutés dans la perspective d’offrir des pistes de réflexion pour les milieux scolaires qui souhaitent mieux répondre aux besoins des élèves doués., The main objective of this study is to document the academic and social experience of gifted secondary school students, grouped together in a "gifted" program in Quebec. The specific objectives are to understand the students' perspective with regard to their academic experience and their individual experience within their class. Their point of view is therefore at the heart of the process, in order to capture their academic, social, and individual perceptions of the educational measures from which they benefit (regrouping, acceleration, enrichment). To do this we relied on theoretical models of giftedness according to Renzulli and Gagné as well as on theoretical models of school experience according to Dubet and Rochex. A qualitative approach that relies on life stories, semi-structured interviews, and group interview was favored to gather and analyze the data from the 12 participants. Our results suggest that the gifted program is generally appreciated by the students, in particular the social dimension of the school pathway. The academic and individual dimensions are more nuanced, in particular, because of criticisms concerning the lack of acceleration and the lack of educational differentiation. However, the result is a predominantly positive school experience for these students thanks to grouping throughout secondary schooling. The results are discussed in order to provide schools some advice and reflections to adequately meet the needs of gifted students.
- Published
- 2020
19. Analysis of the body structure of Djallonke sheep using a multideterminant approach.
- Author
-
Birteeb, Peter T., Peters, Sunday O., and Ozoje, Michael O.
- Abstract
Copyright of Animal Genetic Resources is the property of Cambridge University Press and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2014
- Full Text
- View/download PDF
20. Exploration des liens formels entre les méthodes statistiques et neuronales en classification
- Author
-
Gueye, Ndiouga and Gueye, Ndiouga
- Published
- 2019
21. Space-time analysis of hospitalised dengue patients in rural Thailand reveals important temporal intervals in the pattern of dengue virus transmission.
- Author
-
Aldstadt, Jared, Yoon, In-Kyu, Tannitisupawong, Darunee, Jarman, Richard G., Thomas, Stephen J., Gibbons, Robert V., Uppapong, Angkana, Iamsirithaworn, Sopon, Rothman, Alan L., Scott, Thomas W., and Endy, Timothy
- Subjects
- *
THERAPEUTICS , *DENGUE , *HOSPITAL care , *DENGUE viruses , *SEROLOGY , *CLUSTER analysis (Statistics) , *PATIENTS - Abstract
Objective To determine the temporal intervals at which spatial clustering of dengue hospitalisations occurs. Methods Space-time analysis of 262 people hospitalised and serologically confirmed with dengue virus infections in Kamphaeng Phet, Thailand was performed. The cases were observed between 1 January 2009 and 6 May 2011. Spatial coordinates of each patient's home were captured using the Global Positioning System. A novel method based on the Knox test was used to determine the temporal intervals between cases at which spatial clustering occurred. These intervals are indicative of the length of time between successive illnesses in the chain of dengue virus transmission. Results The strongest spatial clustering occurred at the 15-17-day interval. There was also significant spatial clustering over short intervals (2-5 days). The highest excess risk was observed within 200 m of a previous hospitalised case and significantly elevated risk persisted within this distance for 32-34 days. Conclusions Fifteen to seventeen days are the most likely serial interval between successive dengue illnesses. This novel method relies only on passively detected, hospitalised case data with household locations and provides a useful tool for understanding region-specific and outbreak-specific dengue virus transmission dynamics. [ABSTRACT FROM AUTHOR]
- Published
- 2012
- Full Text
- View/download PDF
22. Spatial analysis of tuberculosis in an Urban West African setting: is there evidence of clustering?
- Author
-
Touray, K., Adetifa, I. M., Jallow, A., Rigby, J., Jeffries, D., Cheung, Y. B., Donkor, S., Adegbola, R. A., and Hill, P. C.
- Subjects
- *
TUBERCULOSIS , *SPATIAL analysis (Statistics) , *GEODATABASES - Abstract
Objectives To describe the pattern of tuberculosis (TB) occurrence in Greater Banjul, The Gambia with Geographical Information Systems (GIS) and Spatial Scan Statistics (SaTScan) and to determine whether there is significant TB case clustering. Methods In Greater Banjul, where 80% of all Gambian TB cases arise, all patients with TB registered at chest clinics between March 2007 and February 2008 were asked to participate. Demographic, clinical characteristics and GPS co-ordinates for the residence of each consenting TB case were recorded. A spatial scan statistic was used to identify purely spatial and space–time clusters of tuberculosis among permanent residents. Results Of 1145 recruited patients with TB, 84% were permanent residents with 88% living in 37 settlements that had complete maps available down to settlement level. Significant high- and low-rate spatial and space–time clusters were identified in two districts. The most likely cluster of high rate from both the purely spatial analysis and the retrospective space–time analysis were from the same geographical area. A significant secondary cluster was also identified in one of the densely populated areas of the study region. Conclusions There is evidence of significant clustering of TB cases in Greater Banjul, The Gambia. Systematic use of cluster detection techniques for regular TB surveillance in The Gambia may aid effective deployment of resources. However, passive case detection dictates that community-based active case detection and risk factor surveys would help confirm the presence of true clusters and their causes. [ABSTRACT FROM AUTHOR]
- Published
- 2010
- Full Text
- View/download PDF
23. La asociatividad como fenómeno evolutivo, análisis de casos colombianos.
- Author
-
Juan Gonzalo, Castellanos M.
- Subjects
- *
ASSOCIATIVITY (Propositional logic) , *GLOBALIZATION , *SYSTEMS theory , *TECHNOLOGICAL innovations , *COOPERATION - Abstract
Associativity, seen in the formation of business networks or clusters located in companies of a specific industrial sector, has been studied by various authors from the developed world. For Latinamerica and for PYMES represent an important advantage as a way of grouping them facing the productive and competitive challenges and the opportunities in marketing niches that are open in globalization. Specifically, they represent a way for establishing cooperation and collaboration trends, competing in the market and innovation fields. For this analysis the ongoing state of experiences through comparative cases, it is necessary to take the evolution focus as a referent for this situation, especially for the innovation phenomenon. Nelson- 1994; Melcalfe- 1994; Lundvall-1992, have stated the evolution strategies of change and systematic perspectives for the innovation that provides a framework for analysis. Similarly, the inclusion of a systems theory and networks to the field of microeconomy, Potts- 2008, and the proposed policies of science and technology that go together with innovation practices, Teubal- 2006, definitely facilitate the description of this evolution. This research paper shows a comparative analysis of two experiences on industrial grouping in Colombia that are currently being built, a perspective in the evolution of associativity and suggests the steps of such evolution, proposing that associativity reaches the phases that show more or less definite features. This proposal of steps has consequences on industrial groupings that are clearly represented by tractor companies, developed by facilitating agents or created by such companies. Besides, it describes effects on the evolution of polices for science, technology and innovation. [ABSTRACT FROM AUTHOR]
- Published
- 2010
- Full Text
- View/download PDF
24. Clustering as Anti-politics Machine? Situating the Politics of Regional Economic Development and Malaysia's Multimedia Super Corridor.
- Author
-
Lepawsky, Josh
- Subjects
INDUSTRIAL clusters ,TECHNOLOGICAL progress ,ECONOMIC policy ,GOVERNMENT policy ,TECHNOLOGICAL revolution ,DEVELOPING countries ,ECONOMIC activity ,TECHNOLOGICAL innovations & economics - Abstract
Lepawsky J. Clustering as anti-politics machine? Situating the politics of regional economic development and Malaysia's Multimedia Super Corridor, Regional Studies. This paper addresses the formation of an 'intentional cluster' in Malaysia called the Multimedia Super Corridor. In this context, 'clustering' is a spatial fix and a development discourse that is as much about political expediency as it is about economic development. This paper suggests the utility of theorizing clusters as 'anti-politics machines' in terms of their instrumental utility for depoliticizing the reproduction and expansion of state bureaucracy and capital accumulation. [image omitted] Lepawsky J. Le regroupement comme une machine contre-politique? Le positionnement de la politique d'amenagement du territoire et de l'Autoroute Multimedia en Malaysie, Regional Studies. Cet article cherche a aborder l'etablissement d'un 'regroupement voulu' en Malaysie appelle l'Autoroute Multimedia. Dans ce contexte, la notion de 'regroupement' constitue une fixation geographique et un discours de developpement qui concerne autant l'opportunisme politique que le developpement economique. Cet article propose l'utilite de theoriser les regroupements comme 'machines contre-politique' vu leur utilite de depolitiser la reproduction et l'elargissement de la bureaucratie d'Etat et l'accumulation de capital. Regroupement Politique culturelle Malaysie Lepawsky J. Clusterbildung als antipolitische Maschine? Untersuchung der Politik zur regionalen Wirtschaftsentwicklung und des Multimedia Super Corridor von Malaysia, Regional Studies. In diesem Beitrag wird die Bildung eines 'beabsichtigten Clusters' namens Multimedia Super Corridor in Malaysia untersucht. In diesem Zusammenhang stellt die Clusterbildung eine raumliche Korrekturmassnahme und einen Entwicklungsdiskurs dar, bei dem es nicht nur um Wirtschaftsentwicklung geht, sondern auch um politischen Eigennutz. Im Artikel wird der Nutzen einer Theoretisierung von Clustern als 'antipolitischen Maschinen' nahegelegt, was ihre zentrale Rolle bei der Entpolitisierung der Reproduktion und Ausdehnung der staatlichen Burokratie und Kapitalanhaufung anbelangt. Clusterbildung Kulturpolitik Malaysia Lepawsky J. ¿Aglomeracion como maquina antipolitica? Situacion de la politica del desarrollo economico regional y el Super Corredor Multimedia de Malasia, Regional Studies. En este articulo analizo la formacion de una 'aglomeracion deliberada' en Malasia denominada el Super Corredor Multimedia. En este contexto, la 'aglomeracion' es un remedio espacial y un discurso de desarrollo que trata sobre la conveniencia politica pero tambien sobre el desarrollo economico. En este articulo sugiero la utilidad de la teorizacion de las aglomeraciones como 'maquinas antipoliticas' en cuanto a su utilidad instrumental para despolitizar la reproduccion y expansion de la burocracia estatal y la acumulacion de capital. Aglomeracion Politica cultural Malasia [ABSTRACT FROM AUTHOR]
- Published
- 2009
- Full Text
- View/download PDF
25. A statistical practical methodology of statewide traffic pattern grouping and precision analysis.
- Author
-
Bassan, Shy
- Subjects
- *
TRAFFIC flow , *VEHICLE detectors , *TRAFFIC patterns , *TRAFFIC engineering , *PRECISION (Information retrieval) , *INTERVAL analysis , *SAMPLE size (Statistics) - Abstract
Traffic data in general and traffic volume in particular are collected to determine the use and performance of the roadway system. Due to budget limitations, traffic volume cannot be counted day by day for every roadway within the state. Therefore, the volume on roadways without automatic traffic recorders (ATRs) can be determined by taking portable short-duration counts and using adjustment factors to produce annual average daily traffic (AADT) at a specific location. This study presents a statistical practical methodology that develops traffic pattern groups (TPGs) by combining roadways with similar traffic characteristics such as volume, seasonal variation, and land use in Delaware, USA. Monthly seasonal adjustment factors and their coefficient of variance (FCV) are analyzed for each group. To meet the desired confidence level and precision intervals, the TPGs’ ATR inventory is examined such that the required sample size is determined by the critical month. [ABSTRACT FROM AUTHOR]
- Published
- 2009
- Full Text
- View/download PDF
26. Designing Visual Analytics Methods for Massive Collections of Movement Data.
- Author
-
Andrienko, Natalia and Andrienko, Gennady
- Subjects
- *
ELECTRONIC data processing , *VISUALIZATION , *DATABASES , *SENSORY perception , *VISUAL perception - Abstract
Exploration and analysis of large data sets cannot be carried out using purely visual means but require the involvement of database technologies, computerized data processing, and computational analysis methods. An appropriate combination of these technologies and methods with visualization may facilitate synergetic work of computer and human whereby the unique capabilities of each “partner” can be utilized. We suggest a systematic approach to defining what methods and techniques, and what ways of linking them, can appropriately support such a work. The main idea is that software tools prepare and visualize the data so that the human analyst can detect various types of patterns by looking at the visual displays. To facilitate the detection of patterns, we must understand what types of patterns may exist in the data (or, more exactly, in the underlying phenomenon). This study focuses on data describing movements of multiple discrete entities that change their positions in space while preserving their integrity and identity. We define the possible types of patterns in such movement data on the basis of an abstract model of the data as a mathematical function that maps entities and times onto spatial positions. Then, we look for data transformations, computations, and visualization techniques that can facilitate the detection of these types of patterns and are suitable for very large data sets – possibly too large for a computer's memory. Under such constraints, visualization is applied to data that have previously been aggregated and generalized by means of database operations and/or computational techniques. [ABSTRACT FROM AUTHOR]
- Published
- 2007
- Full Text
- View/download PDF
27. In vivo filtering of in vitro expression data reveals MyoD targets
- Author
-
Zhao, Po, Seo, Jinwook, Wang, Zuyi, Wang, Yue, Shneiderman, Ben, and Hoffman, Eric P.
- Subjects
- *
GENE targeting , *REGENERATION (Biology) , *ANIMAL genetics , *MICE physiology , *GENES - Abstract
A published set of downstream targets of MyoD defined in a well-controlled in vitro experiment was filtered for relevance to muscle regeneration using a 27-time-point in vivo murine regeneration series. Using interactive hierarchical and Bayes soft clustering, only a minority of the targets defined in vitro can be confirmed in vivo (
∼50% of induced transcripts, and none of repressed transcripts). This approach provided strong support that 18 targets including of MyoD are biologically relevant during myoblast differentiation. To cite this article: P. Zhao et al., C. R. Biologies 326 (2003). [Copyright &y& Elsevier]- Published
- 2003
- Full Text
- View/download PDF
28. USING THE ANALYTIC HIERARCHY PROCESS FOR QUANTIFYING AND CLASSIFYING OBJECTS WITH MULTIPLE ATTRIBUTES.
- Author
-
Zahir, Sajjad
- Subjects
EUCLIDEAN algorithm ,VECTOR spaces ,CLUSTER analysis (Statistics) - Abstract
Copyright of INFOR is the property of Taylor & Francis Ltd and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2002
- Full Text
- View/download PDF
29. Problèmes de clustering liés à la synchronie en écologie : estimation de rang effectif et détection de ruptures sur les arbres
- Author
-
Thépaut, Solène, Laboratoire de Mathématiques d'Orsay (LMO), Université Paris-Sud - Paris 11 (UP11)-Centre National de la Recherche Scientifique (CNRS), Statistique mathématique et apprentissage (CELESTE), Inria Saclay - Ile de France, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire de Mathématiques d'Orsay (LMO), Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Université Paris-Saclay, and Christophe Giraud
- Subjects
Machine Learning ,Synchrony ,Unsupervised classification ,[SDV.EE.ECO]Life Sciences [q-bio]/Ecology, environment/Ecosystems ,[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] ,Regroupement ,Synchronie ,Apprentissage machine ,Classification non supervisée ,Clustering - Abstract
In the view of actual global changes widely caused by human activities, it becomes urgent to understand the drivers of communities' stability. Synchrony between time series of abundances is one of the most important mechanisms. This thesis offers three different angles in order to answer different questions linked to interspecific and spatial synchrony. The works presented find applications beyond the ecological frame. A first chapter is dedicated to the estimation of effective rank of matrices in ℝ or ℂ. We offer tools allowing to measure the synchronisation rate of observations matrices. In the second chapter, we base on the existing work on change-points detection problem on chains in order to offer algorithms which detects change-points on trees. The methods can be used with most data that have to be represented as a tree. In order to study the link between interspecific synchrony and long term tendencies or traits of butterflies species, we offer in the last chapter adaptation of clustering and supervised machine learning methods, such as Random Forest or Artificial Neural Networks to ecological data.; Au vu des changements globaux actuels engendrés en grande partie par l'être humain, il devient nécessaire de comprendre les moteurs de la stabilité des communautés d'êtres vivants. La synchronie des séries temporelles d'abondances fait partie des mécanismes les plus importants. Cette thèse propose trois angles différents permettant de répondre à différentes questions en lien avec la synchronie interspécifique ou spatiale. Les travaux présentés trouvent des applications en dehors du cadre écologique. Un premier chapitre est consacré à l'estimation du rang effectif de matrices à valeurs dans ℝ ou ℂ. Nous apportons ainsi des outils permettant de mesurer le taux de synchronisation d'une matrice d'observations. Dans le deuxième chapitre, nous nous basons sur les travaux existants sur le problème de détection de ruptures sur les chaînes afin de proposer plusieurs algorithmes permettant d'adapter ce problème au cas des arbres. Les méthodes présentées peuvent être utilisées sur la plupart des données nécessitant d'être représentées sous la forme d'un arbre. Afin d'étudier les liens entre la synchronie interspécifique et les tendances à long termes ou les traits d'espèces de papillons, nous proposons dans le dernier chapitre d'adapter des méthodes de clustering et d'apprentissage supervisé comme les Random Forest ou les Réseaux de Neurones artificiels à des données écologiques.
- Published
- 2019
30. Clustering problems for synchrony in ecology : estimation of effective rank and change-points detection on trees
- Author
-
Thépaut, Solène, Laboratoire de Mathématiques d'Orsay (LMO), Centre National de la Recherche Scientifique (CNRS)-Université Paris-Sud - Paris 11 (UP11), Université Paris-Saclay, and Christophe Giraud
- Subjects
Machine Learning ,Synchrony ,Unsupervised classification ,[SDV.EE.ECO]Life Sciences [q-bio]/Ecology, environment/Ecosystems ,[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] ,Regroupement ,Synchronie ,Apprentissage machine ,Classification non supervisée ,Clustering - Abstract
In the view of actual global changes widely caused by human activities, it becomes urgent to understand the drivers of communities' stability. Synchrony between time series of abundances is one of the most important mechanisms. This thesis offers three different angles in order to answer different questions linked to interspecific and spatial synchrony. The works presented find applications beyond the ecological frame. A first chapter is dedicated to the estimation of effective rank of matrices in ℝ or ℂ. We offer tools allowing to measure the synchronisation rate of observations matrices. In the second chapter, we base on the existing work on change-points detection problem on chains in order to offer algorithms which detects change-points on trees. The methods can be used with most data that have to be represented as a tree. In order to study the link between interspecific synchrony and long term tendencies or traits of butterflies species, we offer in the last chapter adaptation of clustering and supervised machine learning methods, such as Random Forest or Artificial Neural Networks to ecological data.; Au vu des changements globaux actuels engendrés en grande partie par l'être humain, il devient nécessaire de comprendre les moteurs de la stabilité des communautés d'êtres vivants. La synchronie des séries temporelles d'abondances fait partie des mécanismes les plus importants. Cette thèse propose trois angles différents permettant de répondre à différentes questions en lien avec la synchronie interspécifique ou spatiale. Les travaux présentés trouvent des applications en dehors du cadre écologique. Un premier chapitre est consacré à l'estimation du rang effectif de matrices à valeurs dans ℝ ou ℂ. Nous apportons ainsi des outils permettant de mesurer le taux de synchronisation d'une matrice d'observations. Dans le deuxième chapitre, nous nous basons sur les travaux existants sur le problème de détection de ruptures sur les chaînes afin de proposer plusieurs algorithmes permettant d'adapter ce problème au cas des arbres. Les méthodes présentées peuvent être utilisées sur la plupart des données nécessitant d'être représentées sous la forme d'un arbre. Afin d'étudier les liens entre la synchronie interspécifique et les tendances à long termes ou les traits d'espèces de papillons, nous proposons dans le dernier chapitre d'adapter des méthodes de clustering et d'apprentissage supervisé comme les Random Forest ou les Réseaux de Neurones artificiels à des données écologiques.
- Published
- 2019
31. Recherche de signaux faibles dans un contexte d’investigation numérique
- Author
-
Maitre, Julien, Ménard, Michel, Bouju, Alain, Chiron, Guillaume, Laboratoire Informatique, Image et Interaction - EA 2118 (L3I), Université de La Rochelle (ULR), ISTE Editions, and Maitre, Julien
- Subjects
[INFO.INFO-TT]Computer Science [cs]/Document and Text Processing ,Plongement de mots ,LDA ,Topic Modeling ,Regroupement ,Word Embeddings ,[INFO.INFO-TT] Computer Science [cs]/Document and Text Processing ,Word2Vec ,Modèle de thèmes ,Clustering - Abstract
This paper is related to a wide project aiming at discoving from different streams of information (i.e. daily publication from the Internet), weak signals possibly sent by whistleblowers. The current study presented in this paper tackles the particular problem of clustering topics at multi-levels from multiple documents, and then extracting meaningful descriptors, such as weighted lists of words. In this context, we present a novel idea combining LDA (in charge clustering) and Word2vec (providing a consistency metric regarding the partitioned topics) as potential method for limiting the "a priori" number of cluster K usually needed in classical partitioning approaches. We proposed 2 implementations of this idea, respectively able to: (1) finding the optimal K for LDA; (2) gathering the optimal clusters from different levels of clustering., L'étude présentée s'inscrit dans le cadre du développement d'une plateforme d'analyse automatique de documents associée à un service sécurisé lanceurs d'alerte, de type GlobalLeaks, focalisé sur la révélation de faits/événements/actions en lien avec des problématiques environnementales. Le présent article aborde le problème particulier du regroupement de sujets à plusieurs niveaux à partir de documents multiples, puis de l'extraction de descripteurs significatifs, tels que des listes pondérées de mots. Dans ce contexte, nous présentons une nouvelle idée combinant LDA (en charge du clustering) et Word2vec (fournissant une métrique de cohérence concernant les sujets partitionnés) comme méthode potentielle pour limiter le nombre "a priori" de cluster K habituellement nécessaire dans les approches classiques du partitionnement. Nous avons proposé 2 mises en œuvre de cette idée, respectivement en mesure de : (1) trouver le K optimal pour LDA ; (2) rassembler les clusters optimaux de différents niveaux de clustering.
- Published
- 2019
32. Détection de signaux faibles dans des masses de données faiblement structurées
- Author
-
Maitre, Julien, Ménard, Michel, Chiron, Guillaume, Bouju, Alain, Laboratoire Informatique, Image et Interaction - EA 2118 (L3I), and Université de La Rochelle (ULR)
- Subjects
[INFO.INFO-TT]Computer Science [cs]/Document and Text Processing ,Plongement de mots ,Topic Modeling ,LDA ,Regroupement ,Word Embeddings ,Word2Vec ,Modèle de thèmes ,Clustering - Abstract
International audience; This paper is related to a project aiming at discovering weak signals from different streams of information, possibly sent by whistleblowers in a platform as GlobalLeaks. The study presented in this paper tackles the particular problem of clustering topics at multi-levels from multiple documents, and then extracting meaningful descriptors, such as weighted lists of words for document representations in a multi-dimensions space. In this context, we present a novel idea which combines Latent Dirichlet Allocation and Word2Vec (providing a consistency metric regarding the partitioned topics) as potential method for limiting the "a priori" number of cluster k usually needed in classical partitioning approaches. We proposed 2 implementations of this idea, respectively able to: (1) finding the best k for LDA in terms of topic consistency; (2) gathering the optimal clusters from different levels of clustering. We also proposed a non-traditional visualization approach based on a multi-agents system which combines both dimension reduction and interactivity.; L'étude présentée s'inscrit dans le cadre du développement d'une plateforme d'analyse automatique de documents associée à un service sécurisé lanceurs d'alerte, de type GlobalLeaks. Cet article se focalise principalement sur la recherche de signaux faibles présents dans les documents. Il s'agit d'une problématique investiguée dans un grand nombre de champs disciplinaires et de cadres applicatifs. Nous supposons que chaque document est un mélange d'un petit nombre de thèmes ou catégories, et que la création de chaque mot est attribuable en termes de probabilités à l'un des thèmes du document. Les catégories des documents transmis ne sont pas connues"a priori". Les mots-clés présents dans les documents représentatifs de ces catégories sont également inconnus. L'analyse des documents reçus doit simultanément permettre de découvrir les thèmes, classer les documents relativement à ces thèmes, détecter les mots-clés pertinents relatifs aux thèmes et enfin découvrir les mots-clés relevant d'un thème "signal faible" éventuel. Pour atteindre cet objectif, nous proposons une définition du signal faible qui conditionne l'approche conjointe modèle thématique / plongement lexical, et contraint le choix des méthodes LDA et Word2Vec. Nous proposons d'évaluer les partitions obtenues grâce à un indice de cohérence sur la collection de mots représentative de chaque thème obtenu. Les clusters obtenus sont ainsi plus cohérents au sens contextuel. La détection du cluster associé au signal faible est alors plus aisée et plus pertinente.
- Published
- 2019
- Full Text
- View/download PDF
33. Detection of weak signals in weakly structured data masses
- Author
-
Alain Bouju, Guillaume Chiron, Michel Ménard, Julien Maitre, Laboratoire Informatique, Image et Interaction - EA 2118 (L3I), and Université de La Rochelle (ULR)
- Subjects
[INFO.INFO-TT]Computer Science [cs]/Document and Text Processing ,Plongement de mots ,Topic Modeling ,LDA ,Regroupement ,Word Embeddings ,General Earth and Planetary Sciences ,Word2Vec ,Modèle de thèmes ,Clustering - Abstract
International audience; This paper is related to a project aiming at discovering weak signals from different streams of information, possibly sent by whistleblowers in a platform as GlobalLeaks. The study presented in this paper tackles the particular problem of clustering topics at multi-levels from multiple documents, and then extracting meaningful descriptors, such as weighted lists of words for document representations in a multi-dimensions space. In this context, we present a novel idea which combines Latent Dirichlet Allocation and Word2Vec (providing a consistency metric regarding the partitioned topics) as potential method for limiting the "a priori" number of cluster k usually needed in classical partitioning approaches. We proposed 2 implementations of this idea, respectively able to: (1) finding the best k for LDA in terms of topic consistency; (2) gathering the optimal clusters from different levels of clustering. We also proposed a non-traditional visualization approach based on a multi-agents system which combines both dimension reduction and interactivity.; L'étude présentée s'inscrit dans le cadre du développement d'une plateforme d'analyse automatique de documents associée à un service sécurisé lanceurs d'alerte, de type GlobalLeaks. Cet article se focalise principalement sur la recherche de signaux faibles présents dans les documents. Il s'agit d'une problématique investiguée dans un grand nombre de champs disciplinaires et de cadres applicatifs. Nous supposons que chaque document est un mélange d'un petit nombre de thèmes ou catégories, et que la création de chaque mot est attribuable en termes de probabilités à l'un des thèmes du document. Les catégories des documents transmis ne sont pas connues"a priori". Les mots-clés présents dans les documents représentatifs de ces catégories sont également inconnus. L'analyse des documents reçus doit simultanément permettre de découvrir les thèmes, classer les documents relativement à ces thèmes, détecter les mots-clés pertinents relatifs aux thèmes et enfin découvrir les mots-clés relevant d'un thème "signal faible" éventuel. Pour atteindre cet objectif, nous proposons une définition du signal faible qui conditionne l'approche conjointe modèle thématique / plongement lexical, et contraint le choix des méthodes LDA et Word2Vec. Nous proposons d'évaluer les partitions obtenues grâce à un indice de cohérence sur la collection de mots représentative de chaque thème obtenu. Les clusters obtenus sont ainsi plus cohérents au sens contextuel. La détection du cluster associé au signal faible est alors plus aisée et plus pertinente.
- Published
- 2019
- Full Text
- View/download PDF
34. Département d'urgence : un élément d'une chaîne de santé
- Author
-
Aroua, Abdeljelil and Aroua, Abdeljelil
- Published
- 2018
35. 'L'extinction est la règle, la survie est l'exception': Regroupement de maliciels selon leurs comportements
- Author
-
Wang, Shengrui, Frappier, Marc, Martel, Claire, Massicotte, Frédéric, Wang, Shengrui, Frappier, Marc, Martel, Claire, and Massicotte, Frédéric
- Abstract
De nombreux maliciels sont détectés tous les jours, cependant, la plupart de ces derniers ne sont pas nouveaux mais simplement des variations de maliciels déjà connus. Du fait de toutes ces variantes, il existe de nombreuses étiquettes données par les antivirus pour une même famille de maliciels. Il faut donc trouver un moyen de classifier un maliciel inconnu avec ceux ayant le même comportement malgré la diversité des étiquettes données par les antivirus. Le but de ce mémoire est d'effectuer le regroupement par l'analyse dynamique et l'analyse statique pour pouvoir classifier les maliciels aux comportements semblables. L'analyse dynamique consiste à exécuter le maliciel dans un environnement contrôlé et à enregistrer les traces d'exécution, tandis que l'analyse statique revient à étudier le maliciel sans l'exécuter. En utilisant et modifiant l'algorithme Malheur, cette étude vise à mettre en place un système d'agrégation de maliciels qui opère dans un temps raisonnable pour permettre le regroupement d'un grand nombre d'éléments. L'idée est donc de créer un système qui ingère des maliciels, les classifie et d'extraire un profil type pour chaque groupe afin de le réutiliser pour détecter ou se protéger des maliciels. Un objectif de cette étude est aussi de pouvoir visualiser le résultat de ce regroupement sous forme de graphes ainsi que comparer les résultats de l'agrégation avec ceux donnés par les antivirus. Pour ce faire, nous utilisons les résultats de différentes analyses automatisées de fichiers exécutables du CCRIC comme éléments en entrée de l'algorithme de regroupement. Nous utilisons une implémentation de l'algorithme Malheur avec l'utilisation de recherche approximative pour effectuer le regroupement et nous utilisons une variation d'AVClass pour déterminer à quelle famille un maliciel appartient. Pour vérifier la précision de notre agrégation, nous utilisons le coefficient Silhouette, ainsi que l'exactitude. Les résultats montrent que l'utilisation de la
- Published
- 2018
36. 'Leviers de regroupement et politique de site. L'expérience de l'Université Clermont Auvergne et Université Clermont Auvergne et associés', in: Les regroupements dans l’enseignement supérieur et la recherche, Actes du colloque de Poitiers des 9 et 10 novembre 2017, E. Aubin et E. Guiselin (dir.), Presses universitaires juridiques de Poitiers, 2018, pp. 123-128
- Author
-
Faberon, Florence, Centre Michel de l'Hospital : laboratoire de recherche en sciences juridiques et politiques (CMH ), Université Clermont Auvergne [2017-2020] (UCA [2017-2020]), Presses universitaires juridiques de Poitiers, and VITALIEN-CHARBONNEL, Audrey
- Subjects
[SHS.DROIT]Humanities and Social Sciences/Law ,politique de site ,[SHS.DROIT] Humanities and Social Sciences/Law ,Université Clermont Auvergne ,regroupement ,ComputingMilieux_MISCELLANEOUS - Abstract
National audience
- Published
- 2018
37. Multi-document Update-summarization
- Author
-
Mnasri, Maali, Laboratoire Vision et Ingénierie des Contenus (LVIC), Département Intelligence Ambiante et Systèmes Interactifs (DIASI), Laboratoire d'Intégration des Systèmes et des Technologies (LIST), Direction de Recherche Technologique (CEA) (DRT (CEA)), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Direction de Recherche Technologique (CEA) (DRT (CEA)), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Laboratoire d'Intégration des Systèmes et des Technologies (LIST), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay, Université Paris-Saclay, Gaël de Chalendar, Laboratoire d'Intégration des Systèmes et des Technologies (LIST (CEA)), and Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Laboratoire d'Intégration des Systèmes et des Technologies (LIST (CEA))
- Subjects
ILP ,Similarité sémantique ,[INFO.INFO-TT]Computer Science [cs]/Document and Text Processing ,Semantic similarity ,Regroupement ,Analyse discursive ,Clustering ,Discourse analysis - Abstract
This thesis focuses on text Automatic Summarization and particularly on UpdateSummarization. This research problem aims to produce a differential summary of a set of newdocuments with regard to a set of old documents assumed to be known. It thus adds two issues to thetask of generic automatic summarization: the temporal dimension of the information and the history ofthe user. In this context, the work presented here is based on an extractive approach using integerlinear programming (ILP) and is organized around two main axes: the redundancy detection betweenthe selected information and the user history and the maximization of their saliency . For the first axis,we were particularly interested in the exploitation of inter-sentence similarities to detect theredundancies between the information of the new documents and those present in the already knownones, by defining a method of semantic clustering of sentences. Concerning our second axis, westudied the impact of taking into account the discursive structure of documents, in the context of theRhetorical Structure Theory (RST), to favor the selection of information considered as the mostimportant. The benefit of the methods thus defined has been demonstrated in the context ofevaluations carried out on the data of TAC and DUC campaigns. Finally, the integration of thesesemantic and discursive criteria through a delayed fusion mechanism has proved the complementarityof these two axes and the benefit of their combination.; Cette thèse s’intéresse au Résumé Automatique de texte et plus particulièrement au résumémis-à-jour. Cette problématique de recherche vise à produire un résumé différentiel d'un ensemble denouveaux documents par rapport à un ensemble de documents supposés connus. Elle intègre ainsidans la problématique du résumé à la fois la question de la dimension temporelle de l'information etcelle de l’historique de l’utilisateur. Dans ce contexte, le travail présenté s'inscrit dans les approchespar extraction fondées sur une optimisation linéaire en nombres entiers (ILP) et s’articule autour dedeux axes principaux : la détection de la redondance des informations sélectionnées et la maximisationde leur saillance. Pour le premier axe, nous nous sommes plus particulièrement intéressés àl'exploitation des similarités inter-phrastiques pour détecter, par la définition d'une méthode deregroupement sémantique de phrases, les redondances entre les informations des nouveaux documentset celles présentes dans les documents déjà connus. Concernant notre second axe, nous avons étudiél’impact de la prise en compte de la structure discursive des documents, dans le cadre de la Théorie dela Structure Rhétorique (RS), pour favoriser la sélection des informations considérées comme les plusimportantes. L'intérêt des méthodes ainsi définies a été démontré dans le cadre d'évaluations menéessur les données des campagnes TAC et DUC. Enfin, l'intégration de ces critères sémantique etdiscursif au travers d'un mécanisme de fusion tardive a permis de montrer dans le même cadre lacomplémentarité de ces deux axes et le bénéfice de leur combinaison.
- Published
- 2018
38. Règles de répartition des officines sur le territoire, plus une évolution qu’une révolution
- Author
-
Guerriaud, Mathieu, UFR des Sciences de Santé (Université de Bourgogne), Université de Bourgogne (UB), Centre de recherche sur le droit des marchés et des investissements internationaux [Dijon] (CREDIMI), and Université de Bourgogne (UB)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
Transfer ,Pharmacie d’officine ,Répartition territoriale des pharmacies ,[SHS.DROIT]Humanities and Social Sciences/Law ,Transfert ,Grouping ,Population ,Regroupement ,Territorial distribution of pharmacies ,[SDV.SP]Life Sciences [q-bio]/Pharmaceutical sciences ,Community pharmacy - Abstract
International audience; On 3 January 2018 a decree modifying the conditions for the creation, transfer, grouping and sale of a community pharmacy was adopted. This text, pursuant to the law modernising the French health system, modifies and specifies the conditions for the organisation of the network of pharmacies across a territory. One of its objectives is to re-establish a balance between those territories with too many pharmacies and those where there are not enough.; Le 3 janvier 2018 a été adoptée une ordonnance relative à l’adaptation des conditions de création, transfert, regroupement et cession des officines de pharmacie. Ce texte, pris en application de la loi de modernisation de notre système de santé, modifie et précise les conditions d’organisation du maillage territorial officinal. L’un de ses objectifs est de faciliter le rééquilibrage entre les territoires surdotés en officines et ceux qui sont en passe de devenir des déserts pharmaceutiques.
- Published
- 2018
- Full Text
- View/download PDF
39. De la décentralisation à la fédération. Le système universitaire italien en quête de rationalisation
- Author
-
Azzena, Luisa
- Subjects
Université ,Université, fédération, regroupement ,fédération ,regroupement - Published
- 2018
40. Clustering auto-adaptatif et équitable dans les réseaux véhiculaires hybrides
- Author
-
Garbiso, Julian Pedro, Laboratoire Traitement et Communication de l'Information (LTCI), Institut Mines-Télécom [Paris] (IMT)-Télécom Paris, Télécom ParisTech, Marceau Coupechoux, and Ada Diaconescu
- Subjects
Véhicule connecté ,Réseau Ad-Hoc de véhicules - VANet ,Connected car ,Vehicular Ad-Hoc Network - VANet ,OMNeT++ ,Simulation of Urban MObility - SUMO ,Clustering ,Réseau véhiculaire hybride ,Hybrid vehicular network ,[INFO.INFO-NI]Computer Science [cs]/Networking and Internet Architecture [cs.NI] ,[INFO.INFO-MA]Computer Science [cs]/Multiagent Systems [cs.MA] ,Vehicle to Vehicle Communications - V2V ,Regroupement ,Communications Vehicle to Vehicle - V2V ,Simulation mobilité urbaine - SUMO ,IEEE 802.11p - Abstract
For the development of innovative Intelligent Transportation Systems applications, connected vehicles will frequently need to upload and download position-based information to and from servers. These vehicles will be equipped with different Radio Access Technologies (RAT), like cellular and vehicle-to-vehicle (V2V) technologies such as LTE and IEEE 802.11p respectively. Cellular networkscan provide internet access almost anywhere, with QoS guarantees. However, accessing these networks has an economic cost. In this thesis, a multi-hop clustering algorithm is proposed in the aim of reducing the cellular access costs by aggregating information and off-loading data in the V2V network, using the Cluster Head as a single gateway to the cellular network. For the example application of uploading aggregated Floating Car Data, simulation results show that this approach reduce cellular data consumption by more than 80% by reducing the typical redundancy of position-based data in a vehicular network. There is a threefold contribution: First, an approach that delegates the Cluster Head selection to the cellular base station in order to maximize the cluster size, thus maximizing aggregation. Secondly, a self-adaptation algorithm that dynamically changes the maximum number of hops, addressing the trade-off between cellular access reduction and V2V packet loss. Finally, the incorporation of a theory of distributive justice, for improving fairness over time regarding the distribution of the cost in which Cluster Heads have to incur, thus improving the proposal’s social acceptability. The proposed algorithms were tested via simulation, and the results show a significant reduction in cellular network usage, a successful adaptation of the number of hops to changes in the vehicular traffic density, and an improvement in fairness metrics, without affecting network performance.; Dans le cadre du développement des innovations dans les Systèmes de Transport Intelligents, les véhicules connectés devront être capables de télécharger des informations basées sur la position sur et depuis des serveurs distants. Ces véhicules seront équipés avec des différentes technologies d’accès radio, telles que les réseaux cellulaires ou les réseaux véhicule-à-véhicule (V2V) comme IEEE 802.11p. Les réseaux cellulaires, avec une couverture presque omniprésente, fournissent un accès à internet avec garanties de qualité de service. Cependant, l’accès à ces réseaux est payant. Dans cette thèse, un algorithme de clustering multi-saut est proposé avec pour objectif de réduire le coût d’accès au réseau cellulaire en agrégeant des données sur le réseau V2V. Pour faire ceci, le leader du cluster (CH, de l’anglais Cluster Head) est utilisé comme passerelle unique vers le réseau cellulaire. Pour le test d’une application d’exemple pour télécharger du Floating Car Data agrégé, les résultats des simulations montrent que cette approche réduit l’utilisation du réseau cellulaire de plus de 80%, en s’attaquant à la redondance typique des données basées sur la position dans les réseaux véhiculaires. Il y a une contribution en trois parties : Premièrement, une approche pour déléguer la sélection du CH à la station de base du réseau cellulaire afin de maximiser la taille des clusters, et par conséquent le taux de compression. Deuxièmement, un algorithme auto-adaptatif qui change dynamiquement le nombre maximum de sauts afin de maintenir un équilibre entre la réduction des coûts d’accès au réseau cellulaire et le taux de perte de paquets dans le réseau V2V. Finalement, l’incorporation d’une théorie de la justice distributive, afin d’améliorer l’équité sur la durée concernant la distribution des coûts auxquels les CH doivent faire face, améliorant ainsi l’acceptabilité sociale de la proposition. Les algorithmes proposés ont été testés via simulation, et les résultats montrent une réduction significative dans l’utilisation du réseau cellulaire, une adaptation réussie du nombre de sauts aux changements de la densité du trafic véhiculaire, et une amélioration dans les métriques d’équité, sans affecter la performance des réseaux.
- Published
- 2017
41. Model-based multivariate discretization for logistic regression
- Author
-
Ehrhardt, Adrien, Biernacki, Christophe, Vandewalle, Vincent, Heinrich, Philippe, Laboratoire Paul Painlevé - UMR 8524 (LPP), Université de Lille-Centre National de la Recherche Scientifique (CNRS), Crédit Agricole Consumer Finance, MOdel for Data Analysis and Learning (MODAL), Inria Lille - Nord Europe, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire Paul Painlevé - UMR 8524 (LPP), Université de Lille-Centre National de la Recherche Scientifique (CNRS)-Université de Lille-Centre National de la Recherche Scientifique (CNRS)-Evaluation des technologies de santé et des pratiques médicales - ULR 2694 (METRICS), Centre Hospitalier Régional Universitaire [Lille] (CHRU Lille)-Université de Lille-Centre Hospitalier Régional Universitaire [Lille] (CHRU Lille)-Université de Lille-École polytechnique universitaire de Lille (Polytech Lille)-Université de Lille, Sciences et Technologies, Evaluation des technologies de santé et des pratiques médicales - ULR 2694 (METRICS), Centre Hospitalier Régional Universitaire [Lille] (CHRU Lille)-Université de Lille, Laboratoire Paul Painlevé (LPP), Université de Lille-Centre National de la Recherche Scientifique (CNRS)-Université de Lille-Centre National de la Recherche Scientifique (CNRS)-Université de Lille, Sciences et Technologies-Inria Lille - Nord Europe, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Evaluation des technologies de santé et des pratiques médicales - ULR 2694 (METRICS), Université de Lille-Centre Hospitalier Régional Universitaire [Lille] (CHRU Lille)-Université de Lille-Centre Hospitalier Régional Universitaire [Lille] (CHRU Lille)-École polytechnique universitaire de Lille (Polytech Lille), Université de Lille-Centre Hospitalier Régional Universitaire [Lille] (CHRU Lille), Centre Hospitalier Régional Universitaire [Lille] (CHRU Lille)-Université de Lille-Centre Hospitalier Régional Universitaire [Lille] (CHRU Lille)-Université de Lille-École polytechnique universitaire de Lille (Polytech Lille), and Ehrhardt, Adrien
- Subjects
credit scoring ,discrétisation ,logistic regression ,scoring ,regroupement ,[STAT.ML] Statistics [stat]/Machine Learning [stat.ML] ,régression logistique ,grouping ,[STAT.ML]Statistics [stat]/Machine Learning [stat.ML] ,[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] ,risque de crédit ,discretization ,quantization ,preprocessing ,[MATH.MATH-ST] Mathematics [math]/Statistics [math.ST] - Abstract
International audience; Credit institutions are interested in the refunding probability of a loan given the applicant’s characteristics in order to assess the worthiness of the credit. For regulatory and interpretability reasons, the logistic regression is still widely used to learn this probability from the data. Although logistic regression handles naturally both quantitative and qualitative data, two pre-processing steps are usually performed: first, continuous features are discretized by assigning factor levels to pre-determined intervals; second, qualitative features, if they take numerous values, are regrouped into variables taking fewer factor levels. In this communication focus will be given on the discretization of continuous variables which is performed for two main reasons: first, it produces a “scorecard” with a direct correspondence from intervals to score “points”; second, it allows do deal with non linearity of the score with respect to the continuous variables. There already exists many discretization algorithms (see the review from Ramírez‐Gallego et al. (2016)). To the best of our knowledge, the few multivariate supervised algorithms are unsatisfactory in our setup mainly because they are not fully automated, their optimized criterion does not produce suitable discretized features for logistic regression and their approach are empirical. By reinterpreting discretized features as latent variables, we are able, through the use of a Stochastic Expectation-Maximization (SEM) algorithm and a Gibbs sampler, to overcome those shortcomings and to find the best discretization scheme w.r.t. the logistic regression loss. The good performances of this approach are illustrated on simulated and real data from Crédit Agricole Consumer Finance.
- Published
- 2017
42. Rendimiento de la producción agrícola de los municipios pertenecientes a la Oficina de Desarrollo Rural Andradina, SP, Brasil
- Author
-
Alan Rodrigo Panosso, Jaqueline Bonfim de Carvalho, Maria Aparecida Anselmo Tarsitano, Omar Jorge Sabbag, and Universidade Estadual Paulista (Unesp)
- Subjects
H1-99 ,0106 biological sciences ,efficacite agricole ,statistiques multivariée ,multivariate statistics ,eficiencia agrícola ,Andradina ,04 agricultural and veterinary sciences ,regroupement ,01 natural sciences ,Social sciences (General) ,eficiência agropecuária ,agrupamento ,DEA ,grouping ,agricultural efficiency ,estadística multivariante ,040103 agronomy & agriculture ,0401 agriculture, forestry, and fisheries ,agrupamiento ,estatística multivariada ,010606 plant biology & botany - Abstract
Made available in DSpace on 2018-11-12T17:26:56Z (GMT). No. of bitstreams: 0 Previous issue date: 2017-04-01. Added 1 bitstream(s) on 2021-07-14T17:51:16Z : No. of bitstreams: 1 S1518-70122017000200171.pdf: 289383 bytes, checksum: 9493f24ed4c2d6aa2424527c71b8d5fe (MD5) Résumé: La affectation des Bureaux de Développement Rural (EDR) est l'exécution des activités liées aux plans régionaux municipal et le développement rural. L'objectif travail était d'analyser l'efficacité de l'agriculture treize municipalités appartenant à EDR Andradina/SP, par les statistiques multivariées et l'analyse d'enveloppement des données (DEA). Les analyses ont montré que la plupart des unités fonctionne inefficacement, avec Valparaíso et Bento de Abreu comme les municipalités en vedete. Resumo: A atribuição dos Escritórios de Desenvolvimento Rural (EDR) é execução das atividades relativas aos planos regionais e municipais de desenvolvimento rural. O objetivo do trabalho foi analisar a eficiência agropecuária de treze municípios pertencentes ao EDR de Andradina, SP, através da estatística multivariada e análise envoltória de dados (DEA). As análises permitiram concluir que a maioria das unidades trabalha de maneira ineficiente, tendo Valparaíso e Bento de Abreu como municípios destaque. Abstract: The assignment of the Rural Development Offices (EDR) is execution of activities related to regional plans and municipal rural development. The objective of work was to analyze the agricultural efficiency thirteen municipalities belonging to EDR of Andradina/SP, by multivariate statistics and data envelopment analysis (DEA). The analyzes allowed conclude that most units working inefficiently, with Valparaíso and Bento de Abreu highlight municipalities. Resúmen: La asignación de las Oficinas de Desarrollo Rural (EDR) es la ejecución de las actividades relacionadas con los planes regionales y municipales de desarrollo rural. El objetivo del trabajo fue analizar la eficiencia agrícola del trece municipios pertenecientes a la EDR Andradina/SP, por estadística multivariante y análisis envolvente de datos (DEA). Los análisis mostraron que la mayoría de las unidades trabaja de manera ineficiente, con Valparaíso y Bento de Abreu como los municipios destacados. Universidade Estadual Paulista Júlio de Mesquita Filho Universidade Estadual Paulista Júlio de Mesquita Filho
- Published
- 2017
43. La prise en charge des élèves Hauts Potentiels en Belgique, une étude exploratoire auprès des professionnels dans leurs projets d’accompagnement
- Author
-
Lohisse, Samuel, UCL - Faculté de psychologie et des sciences de l'éducation, Day, James, and Toth-Gauthier, Maria
- Subjects
EHP ,analyse thématique ,soutien ,gifted children ,saut de classe ,Intelligence ,Précocité ,diagnostic ,regroupement ,freeman ,mémoire ,HP ,Scolarité ,high potential ,test de QI ,Haut Potentiel ,pédagogie ,day ,besoin ,élève ,belgique ,thème ,pedagogy ,professeur ,high ,zèbre ,toth-gauthier ,galton ,terrassier ,accompagnement ,revol ,Surdoué ,redoublement ,HPI ,kieboom ,brasseur ,student ,Prise en charge ,school ,Intervention ,braun ,IQ test ,exploration ,Education ,wechsler ,evolution ,tutorat ,interview ,gregoire ,terman ,surdouance ,politique ,accélération ,gifted child ,aménagement scolaire ,teacher ,aménagement institutionnel ,gifdness ,clark ,enseignant - Abstract
Etude empirique qualitative exploratoire dans le domaine de la psychologie et de l’Education. C’est un mémoire réalisé comme travail de fin d’étude en Sciences Psychologiques à l’Université Catholique de Louvain par Samuel Lohisse sous la promotion de Monsieur James Meredith Day et la co-promotion de Madame Maria Toth-Gauthier. Il s’agit d’une étude exploratoire sur base d’interviews de professionnels visant essentiellement les différentes interventions au service des enfants haut potentiel. L’objectif de ce mémoire est d’appréhender les aménagements pédagogiques et institutionnels proposés en Belgique ainsi que les diverses prises en charge des enfants à Haut Potentiel. Celles-ci sont analysées selon deux angles différents et d’un point de vue théorique et d’un point de vue pratique. Une revue de la littérature est, au préalable, dressée afin de situer ce travail dans le temps et parmi les études précédentes. Cette configuration offre une articulation théorico-pratique permettant une comparaison directe avec les autres études traitant cette thématique. Cet ouvrage, s’il ne permet pas de généralisation, est intéressant de par l’exploration à même le terrain. Ce sont en effet les interviews des professionnels qui ont servi de base d’analyse thématique ce qui a permis de prendre en compte les contraintes et observations du terrain. Cette manière de procéder offre des pistes de réflexions et bons nombres de perspectives futures pour de prochaines recherches. Master [120] en sciences psychologiques, Université catholique de Louvain, 2017
- Published
- 2017
44. Fair auto-adaptive clustering for hybrid vehicular networks
- Author
-
Garbiso, Julian Pedro, STAR, ABES, Laboratoire Traitement et Communication de l'Information (LTCI), Institut Mines-Télécom [Paris] (IMT)-Télécom Paris, Télécom ParisTech, Marceau Coupechoux, and Ada Diaconescu
- Subjects
Réseau Ad-Hoc de véhicules - VANet ,Véhicule connecté ,Connected car ,Vehicular Ad-Hoc Network - VANet ,[INFO.INFO-NI] Computer Science [cs]/Networking and Internet Architecture [cs.NI] ,OMNeT++ ,Simulation of Urban MObility - SUMO ,Clustering ,Réseau véhiculaire hybride ,[INFO.INFO-NI]Computer Science [cs]/Networking and Internet Architecture [cs.NI] ,Hybrid vehicular network ,[INFO.INFO-MA]Computer Science [cs]/Multiagent Systems [cs.MA] ,Vehicle to Vehicle Communications - V2V ,Regroupement ,Communications Vehicle to Vehicle - V2V ,Simulation mobilité urbaine - SUMO ,[INFO.INFO-MA] Computer Science [cs]/Multiagent Systems [cs.MA] ,IEEE 802.11p - Abstract
For the development of innovative Intelligent Transportation Systems applications, connected vehicles will frequently need to upload and download position-based information to and from servers. These vehicles will be equipped with different Radio Access Technologies (RAT), like cellular and vehicle-to-vehicle (V2V) technologies such as LTE and IEEE 802.11p respectively. Cellular networkscan provide internet access almost anywhere, with QoS guarantees. However, accessing these networks has an economic cost. In this thesis, a multi-hop clustering algorithm is proposed in the aim of reducing the cellular access costs by aggregating information and off-loading data in the V2V network, using the Cluster Head as a single gateway to the cellular network. For the example application of uploading aggregated Floating Car Data, simulation results show that this approach reduce cellular data consumption by more than 80% by reducing the typical redundancy of position-based data in a vehicular network. There is a threefold contribution: First, an approach that delegates the Cluster Head selection to the cellular base station in order to maximize the cluster size, thus maximizing aggregation. Secondly, a self-adaptation algorithm that dynamically changes the maximum number of hops, addressing the trade-off between cellular access reduction and V2V packet loss. Finally, the incorporation of a theory of distributive justice, for improving fairness over time regarding the distribution of the cost in which Cluster Heads have to incur, thus improving the proposal’s social acceptability. The proposed algorithms were tested via simulation, and the results show a significant reduction in cellular network usage, a successful adaptation of the number of hops to changes in the vehicular traffic density, and an improvement in fairness metrics, without affecting network performance., Dans le cadre du développement des innovations dans les Systèmes de Transport Intelligents, les véhicules connectés devront être capables de télécharger des informations basées sur la position sur et depuis des serveurs distants. Ces véhicules seront équipés avec des différentes technologies d’accès radio, telles que les réseaux cellulaires ou les réseaux véhicule-à-véhicule (V2V) comme IEEE 802.11p. Les réseaux cellulaires, avec une couverture presque omniprésente, fournissent un accès à internet avec garanties de qualité de service. Cependant, l’accès à ces réseaux est payant. Dans cette thèse, un algorithme de clustering multi-saut est proposé avec pour objectif de réduire le coût d’accès au réseau cellulaire en agrégeant des données sur le réseau V2V. Pour faire ceci, le leader du cluster (CH, de l’anglais Cluster Head) est utilisé comme passerelle unique vers le réseau cellulaire. Pour le test d’une application d’exemple pour télécharger du Floating Car Data agrégé, les résultats des simulations montrent que cette approche réduit l’utilisation du réseau cellulaire de plus de 80%, en s’attaquant à la redondance typique des données basées sur la position dans les réseaux véhiculaires. Il y a une contribution en trois parties : Premièrement, une approche pour déléguer la sélection du CH à la station de base du réseau cellulaire afin de maximiser la taille des clusters, et par conséquent le taux de compression. Deuxièmement, un algorithme auto-adaptatif qui change dynamiquement le nombre maximum de sauts afin de maintenir un équilibre entre la réduction des coûts d’accès au réseau cellulaire et le taux de perte de paquets dans le réseau V2V. Finalement, l’incorporation d’une théorie de la justice distributive, afin d’améliorer l’équité sur la durée concernant la distribution des coûts auxquels les CH doivent faire face, améliorant ainsi l’acceptabilité sociale de la proposition. Les algorithmes proposés ont été testés via simulation, et les résultats montrent une réduction significative dans l’utilisation du réseau cellulaire, une adaptation réussie du nombre de sauts aux changements de la densité du trafic véhiculaire, et une amélioration dans les métriques d’équité, sans affecter la performance des réseaux.
- Published
- 2017
45. Le regroupement familial des bénéficiaires de la protection internationale en Belgique : quand les politiques sécuritaires prennent le pas sur les droits de l'homme
- Author
-
Izoard, Marin, UCL - Faculté de droit et de criminologie, and Sarolea, Sylvie
- Subjects
famille ,Belgique ,familial ,subsidiaire ,réfugiés ,article 8 ,sécuritaire ,regroupement ,protection ,politique ,protection internationale ,vie privée et familiale ,droits de l'homme ,CEDH ,vie privée - Abstract
A l'heure ou des nombreux conflits font rage à travers le monde, de nombreuses personnes se voient reconnaitre le statut de réfugié, ou bénéficient de la protection subsidiaire, en Belgique et en Europe. La plupart d'entre eux auront pour première préoccupation de réunir autour d'eux leur famille, bien souvent dispersée par le chaos de la migration forcée. L'unité familiale a été consacrée maintes fois en droit international, ainsi que son corollaire direct; le droit au regroupement familial. Nous analysons dans ce mémoire les diverses garanties procédurales reconnues par le droit international, et par la Cour européenne des droits de l'homme dans les procédures de regroupement familial des bénéficiaires de protection internationale. Nous détaillons également leur pendant en droit belge et européen. Nous voyons ainsi que tant dans la mise en place des conditions légales au regroupement familial, que dans l'appréciation de la notion de famille, dans la prise en compte de l'intérêt supérieur de l'enfant ou encore dans l'administration de la preuve du lien familial, les réfugiés et bénéficiaires de la protection subsidiaire doivent faire l'objet d'une attention particulière, et que les instances administratives doivent procéder avec "souplesse, célérité et effectivité". Nous mettons ensuite en lumière les diverses insuffisances actuelles de l'administration belge au regard de ces garanties. Nous démontrons qu'afin d'assurer l'effectivité des droits de l'homme, et en particulier le droit à la vie privée et familiale, certaines actions sont requises de la part du législateur et de l'administration belge; nous proposons au sein de ce mémoire des pistes de solution légales, ainsi que certaines injonctions pour une mise en conformité du Royaume face au droit international. Nous concluons enfin en insistant sur l'importance de dissocier le droit et la politique. Le regroupement familial en effet, véritable droit subjectif lorsque certaines conditions sont remplies, ne peut devenir un instrument général de gestion de la migration. Les politiques sécuritaires doivent en effet s'incliner devant les droits de l'homme, et ne pas restreindre ces droits de manière disproportionnée. Master [120] en droit, Université catholique de Louvain, 2017
- Published
- 2017
46. Using event sequence alignment to automatically segment web users for prediction and recommendation
- Author
-
Luu, Vinh Trung, Modélisation, Intelligence, Processus et Système (MIPS), Ecole Nationale Supérieure d'Ingénieur Sud Alsace-Université de Haute-Alsace (UHA) Mulhouse - Colmar (Université de Haute-Alsace (UHA))-IUT de Colmar-IUT de Mulhouse, Université de Haute Alsace - Mulhouse, and Pierre-Alain Muller
- Subjects
Web mining ,Sequence alignment ,Fouille du web ,Regroupement ,[INFO.INFO-WB]Computer Science [cs]/Web ,Clustering ,Alignement de séquence - Abstract
This thesis explored the application of sequence alignment in web usage mining, including user clustering and web prediction and recommendation.This topic was chosen as the online business has rapidly developed and gathered a huge volume of information and the use of sequence alignment in the field is still limited. In this context, researchers are required to build up models that rely on sequence alignment methods and to empirically assess their relevance in user behavioral mining. This thesis presents a novel methodological point of view in the area and show applicable approaches in our quest to improve previous related work. Web usage behavior analysis has been central in a large number of investigations in order to maintain the relation between users and web services. Useful information extraction has been addressed by web content providers to understand users’ need, so that their content can be correspondingly adapted. One of the promising approaches to reach this target is pattern discovery using clustering, which groups users who show similar behavioral characteristics. Our research goal is to perform users clustering, in real time, based on their session similarity.; Une masse de données importante est collectée chaque jour par les gestionnaires de site internet sur les visiteurs qui accèdent à leurs services. La collecte de ces données a pour objectif de mieux comprendre les usages et d'acquérir des connaissances sur le comportement des visiteurs. A partir de ces connaissances, les gestionnaires de site peuvent décider de modifier leur site ou proposer aux visiteurs du contenu personnalisé. Cependant, le volume de données collectés ainsi que la complexité de représentation des interactions entre le visiteur et le site internet nécessitent le développement de nouveaux outils de fouille de données. Dans cette thèse, nous avons exploré l’utilisation des méthodes d’alignement de séquences pour l'extraction de connaissances sur l'utilisation de site Web (web mining). Ces méthodes sont la base du regroupement automatique d’internautes en segments, ce qui permet de découvrir des groupes de comportements similaires. De plus, nous avons également étudié comment ces groupes pouvaient servir à effectuer de la prédiction et la recommandation de pages. Ces thèmes sont particulièrement importants avec le développement très rapide du commerce en ligne qui produit un grand volume de données (big data) qu’il est impossible de traiter manuellement.
- Published
- 2016
47. The Homogeneity Scale of the universe
- Author
-
Ntelis, Pierros, AstroParticule et Cosmologie (APC (UMR_7164)), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Institut National de Physique Nucléaire et de Physique des Particules du CNRS (IN2P3)-Observatoire de Paris, and Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Centre National de la Recherche Scientifique (CNRS)-Université Paris Cité (UPCité)
- Subjects
Energy ,Cosmology and Nongalactic Astrophysics (astro-ph.CO) ,Matter ,Matière ,Statistics ,Astrophysics::Instrumentation and Methods for Astrophysics ,FOS: Physical sciences ,Redshift ,Astrophysics::Cosmology and Extragalactic Astrophysics ,Surveys ,ΛCDM ,Enquêtes ,Clustering ,Decalage ,Regroupement ,Statistiques ,Énergie ,[PHYS.ASTR]Physics [physics]/Astrophysics [astro-ph] ,Astrophysics - Cosmology and Nongalactic Astrophysics - Abstract
In this study, we probe the cosmic homogeneity with the BOSS CMASS galaxy sample in the redshift region of $0.43 < z < 0.7$. We use the normalised counts-in-spheres estimator $\mathcal{N}(, Comment: 5 pages, 2 figures, Talk presented at The 51th Rencontres de Moriond, March 19-26, 2016, La Thuile, Italy; to appear in the Moriond Conference Proceedings
- Published
- 2016
- Full Text
- View/download PDF
48. Nouveaux logiciels pour la biologie structurale computationnelle et la chémoinformatique
- Author
-
Bérenger, François and STAR, ABES
- Subjects
Virtual screening ,Electrostatic similarity ,[SDV.BBM.BS] Life Sciences [q-bio]/Biochemistry, Molecular Biology/Structural Biology [q-bio.BM] ,Autocorrelation ,Protein ,Similarité électrostatique ,Criblage virtuel ,Regroupement ,[CHIM.CHEM] Chemical Sciences/Cheminformatics ,[SDV.BBM.GTP] Life Sciences [q-bio]/Biochemistry, Molecular Biology/Genomics [q-bio.GN] ,Ligand ,Protéine ,Clustering - Abstract
This thesis introduces five software useful in three different areas : parallel and distributed computing, computational structural biology and chemoinformatics. The software from the parallel and distributed area is PAR. PAR allows to execute independent experiments in a parallel and distributed way. The software for computational structural biology are Durandal, EleKit and Fragger. Durandal exploits the propagation of geometric constraints to accelerate the exact clustering algorithm for protein models. EleKit allows to measure the electrostatic similarity between a chemical molecule and the protein it is designed to replace at a protein-protein interface. Fragger is a fragment picker able to select protein fragments in the whole protein data-bank. Finally, the chemoinformatics software is ACPC. ACPC encodes in a rotation-translation invariant way a chemical molecule in any or a combination of three chemical spaces (electrostatic, steric or hydrophobic). ACPC is a ligand-based virtual screening tool supporting consensus queries, query molecule annotation and multi-core computers., Ma thèse introduit cinq logiciels de trois différents domaines: le calcul parallèle et distribué, la biologie structurale computationnelle et la chémoinformatique. Le logiciel pour le calcul parallèle et distribué s'appelle PAR. PAR permet d'exécuter des expériences indépendantes de manière parallèle et distribuée. Les logiciels pour la biologie structurale computationnelle sont Durandal, EleKit et Fragger. Durandal exploite la propagation de contraintes géométriques afin d'accélérer l'algorithme de partitionnement exact pour des modèles de protéines. EleKit permet de mesurer la similarité électrostatique entre une petite molécule et la protéine qu'elle est conçue pour remplacer sur une interface protéine-protéine. Fragger est un cueilleur de fragments de protéines permettant de sélectionner des fragments dans la banque de protéines mondiale. Enfin, le logiciel de chémoinformatique est ACPC. ACPC permet l'encodage fin, d'une manière rotation-translation invariante, d'une molécule dans un ou une combinaison des trois espaces chimiques (électrostatique, stérique ou hydrophobe). ACPC est un outil de criblage virtuel qui supporte les requêtes consensus, l'annotation de la molécule requête et les processeurs multi-coeurs.
- Published
- 2016
49. Éléments de cartographie des emplois de voilà en vue d’une analyse instructionnelle
- Author
-
Col, Gilles, Danino, Charlotte, Rault, Julien, Formes et Représentations en Linguistique et Littérature (FORELL-EA3816), and Université de Poitiers
- Subjects
polysemy ,written corpus ,instruction ,regroupement ,Constructions ,[SHS]Humanities and Social Sciences ,scène verbale ,grouping ,corpus écrit ,corpus oral ,verbal scene ,oral corpus ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,polysémie - Abstract
The lexical item voilà is fast spreading in contemporary spoken French. This article offers a possible explanation for this rapid expansion by identifying contributing factors. We first describe voilà’s contextual behaviors in both written and spoken corpora. Typical properties arise from the description and are further tested on additional data. Constructions and relatively robust patterns emerge. Voilà is indeed characterized by two essential behaviors – [VOILÀ + pause] and [VOILÀ + entity/process] – and two groups of paired values and statuses – [signpost value + interjection status] and [predicative value + pivotal status]. We then formulate a functional hypothesis in terms of cognitive grouping: voilà would integrate informational elements by grouping them on the verbal scene. The semantic instruction given by voilà would consist in convoking elements on a scene and evoking their grouping into a perceptible set.; Voilà est une unité dont l’usage se répand rapidement en français oral aujourd’hui. Ce travail cherche à proposer une explication de cette expansion en mettant en évidence des facteurs de facilitation. A partir d’une description du comportement de l’unité en contexte (sur corpus oral et écrit), nous mettons en évidence des propriétés typiques qui sont ensuite testées sur des données supplémentaires. Des constructions et des patterns relativement robustes émergent également des analyses sur corpus. Voilà se caractérise par deux comportements essentiels ([VOILÀ + pause] et [VOILÀ + entités/procès]) et deux groupes de valeurs /statuts associés : valeur de balisage + statut d’interjection ; valeur prédicative + statut de pivot. Est alors proposée une hypothèse fonctionnelle qui repose sur l’activité cognitive de regroupement : voilà servirait à intégrer en les regroupant des informations sur une scène verbale. L’instruction sémantique donnée par voilà consisterait ainsi à convoquer des éléments sur une scène et à évoquer leur regroupement dans un ensemble perceptible.Mots-clés : corpus écrit, corpus oral, polysémie, Constructions, instruction, scène verbale, regroupement
- Published
- 2015
50. Les universités parisiennes dans la tourmente des regroupements
- Author
-
Baron, Myriam, Vadelorge, Loïc, LAB'URBA (LAB'URBA), Université Paris-Est Marne-la-Vallée (UPEM)-Université Paris-Est Créteil Val-de-Marne - Paris 12 (UPEC UP12), Géographie-cités (GC (UMR_8504)), Université Paris 1 Panthéon-Sorbonne (UP1)-Université Paris Diderot - Paris 7 (UPD7)-Centre National de la Recherche Scientifique (CNRS), Analyse Comparée des Pouvoirs (ACP), Université Paris-Est Marne-la-Vallée (UPEM), Université Panthéon-Sorbonne (UP1)-Université Paris Diderot - Paris 7 (UPD7)-Centre National de la Recherche Scientifique (CNRS), Baron, Myriam, and Université Paris 1 Panthéon-Sorbonne (UP1)-Centre National de la Recherche Scientifique (CNRS)-Université Paris Diderot - Paris 7 (UPD7)
- Subjects
Paris ,université ,[SHS.GEO] Humanities and Social Sciences/Geography ,universités ,Grand Paris ,[SHS.GEO]Humanities and Social Sciences/Geography ,regroupement ,réforme universitaire ,Île-de-France ,aménagement ,politiques territoriales ,[SHS.HIST] Humanities and Social Sciences/History ,histoire ,région parisienne ,Comue ,[SHS.HIST]Humanities and Social Sciences/History ,ComputingMilieux_MISCELLANEOUS ,politiques publiques - Abstract
International audience; Depuis 2006, les regroupements d'universités et d'établissements sont monnaie courante. Myriam Baron et Loïc Vadelorge défendent l'idée que, au sein de l'agglomération parisienne, les « Comue » sont inadaptées aux pratiques des étudiants et des enseignants, et reposent sur de nombreuses incohérences territoriales.
- Published
- 2015
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.