Accueil > Forum > > > > Suppression de doublon....
Suppression de doublon....
jeudi 6 avril 2006 à 14:09:08 |
Suppression de doublon....

Ry_Yo
|
Bonjour à tous, Je travail sous sqlserver et après recherche sur votre site, je n'ai pas trouvé de méthode pour supprimer des doublon ou triplon, quadruplon...d'une base... prenons par exemple ma table "toto" qui possède un champ unique... champ ------- 1 1 1 1 2 2 3 4 4 4 5
Donc la seule façon que j'ai trouvé c'est de faire un distinct dans une table temporaire, dropper la table principale et la recréer avec les enregistrements de la table temporaire... Bon cette solution est pas trop viable quand c'est une table en production.... Merci de votre aide....
|
|
jeudi 6 avril 2006 à 14:32:46 |
Re : Suppression de doublon....

Mindiell
|
As-tu un champ permettant de différencier les lignes entre elles ?
par exemple :
1 prenom1
1 prenom2
1 prenom3
Sinon, si deux lignes sont exactement egales, alors désolé, mais c'est impossible de le faire directement. Il faut inserer une nouvelle colonne unique...
Tiens nous au courant :o)
|
|
jeudi 6 avril 2006 à 14:50:07 |
Re : Suppression de doublon....

Ry_Yo
|
Hélas si j'avais un identifiant unique ça serait plus simple....
Mais ceux sont vraiment des lignes identiques.... En fait la table a été crée sans id.... ce qui fait que certain user sont des frénésiques du clic et intègre en plusieurs exemplaires les données...
Voilà donc mon problème..... Depuis j'ai mis en place un contrôle avant insertion dans la table par programmation... mais pour les enregistrements déjà passé.... il faudrait que je delete les lignes en x exemplaires......
|
|
jeudi 6 avril 2006 à 15:04:04 |
Re : Suppression de doublon....

Mindiell
|
Comme expliqué ci-dessus :
insère une nouvelle colonne strictement unique afin de nettoyer ta table, puis tu pourras la supprimer...
|
|
jeudi 6 avril 2006 à 17:41:35 |
Re : Suppression de doublon....

Ry_Yo
|
Pour rajouter une colonne ok Mais pour créer un numéro unique ça je ne sais pas faire.....(dsl) ma table comporte 7 millions de lignes... je me vois mal le faire manuellement... Je suppose qu'en faisant une procedure stockée ou autre on peut ajouter un numéro unique en automatique ?
|
|
jeudi 6 avril 2006 à 19:07:00 |
Re : Suppression de doublon....

Mindiell
|
Réponse acceptée !
Sur SQLServer, EntrepriseManager :
- Modifier Table
- Ajoute un champ nommé "idid" ou autre :o)
- Mets le en entier (int)
- Mets le en compteur (la fenetre du dessous)
- Appuye sur "Sauver"
- Va boire 12 cafés et dormir... 13 millions de ligne sont en cours de modifs ;o)
|
|
jeudi 6 avril 2006 à 19:13:13 |
Re : Suppression de doublon....

rvblog
|
Salut Ry_Yo, salut à tous les autres, Solution hypothétique ( plus propre que le DROP), fais un script : Sauvegardes ta table avant ( garantie AS IS), lis le script, et fais-toi ton avis avant de l'exécuter ( je ne voudrais pas être responsable de la fin de ton CPE :) ) 1./ un SELECT PseudoPK, Count(*) INTO TempTablePK FROM TableMoche GROUP BY PseudoPK HAVING count(*) > 1 remplirait une table temporaire avec les clés correpondant aux doublons, triplons...
2./ un SELECT DISTINCT TableMoche.* INTO TempTablePKDoublons FROM TableMoche, TempTablePK WHERE TableMoche.PseudoPK = TempTablePK.PseudoPK remplirait une table temporaire avec les lignes uniques liées à des doublons,...3./ un SELECT PseudoPK, count(*) FROM TempTablePKDoublons GROUP BY PseudoPK vérifierait que chaque ligne est bien unique, en retournant 1 comme compte pour chaque ligne (j'espère pour toi qu'il n'y a pas 3,5 millions de lignes uniques)4./ un DELETE TableMoche FROM TableMoche, TempTablePK WHERE TableMoche.PseudoPK = TempTablePK.PseudoPK effacerait de la table moche juste les lignes possédant les PseudoPK incriminés. 5./ un INSERT TableMoche SELECT * FROM TempTablePKDoublons ré-insèrerait les lignes uniques dont le PseudoPK était incriminé.à+
rvblogn Je veux ton bien... et je l'aurais
|
|
jeudi 6 avril 2006 à 19:54:28 |
Re : Suppression de doublon....

Mindiell
|
Un truc important :
SELECT PseudoPK, count(*)
FROM TempTablePKDoublons
GROUP BY PseudoPK
HAVING count(*)>1
Ca permet de sortir les doublons, et uniquement eux ! ;o)
Deuxièmement, ma solution permet de supprimer les doublons sans jamais en effacer trop dans la table...
A toi de voir !
|
|
jeudi 6 avril 2006 à 22:24:19 |
Re : Suppression de doublon....

rvblog
|
Salut Mindiell, tu as déjà bien raison de relire, c'est important. En effet, pour le point 3, la vérification est plus courte ainsi! Ta solution est celle que j'aurais choisie d'instinct si j'avais le problème, mais ni je n'ai le problème, ni le pouvoir de faire le choix de la solution :)
Ceci dit, pour quand même essayer de vendre ma solution :) je n'aurais jamais, même dans le pire des cas (par ex: 1 seul doublon = 6 999 999 modifs), à modifier 7 millions d'enregistrements, parmi 7 millions d'enregistrements dans une table! du coup, Ry_Yo aura moins de caféïne dans le sang avant d'aller se coucher !)PS : quoi qu'il en soit, on est tous d'accord, une table sans PK, c'est pas une table, c'est une feuille de calcul, et une feuille de calcul avec une seule colonne, c'est pas une feuille de calcul, c'est une punition, et une punition de 7 000 000 de lignes, t'as du faire une sacrée bêtise :)
à+
rvblogn Je veux ton bien... et je l'aurais
|
|
jeudi 6 avril 2006 à 22:40:07 |
Re : Suppression de doublon....

Ry_Yo
|
Merci de votre aide je vais mettre ça en place dès demain.... Ni vu ni connu j'atoute la colonne, je delete les doublons, triplons et autres et j'alter de nouveau ma table en virant l'id... comme ça on m'accusera pas d'avoir touché la structure d'une table en cas de soucis (hypothétique) par la suite.....
|
|
Cette discussion est classée dans : table, champ, suppression, trouvé, doublon
Répondre à ce message
Sujets en rapport avec ce message
probleme de comparaison de table [ par ehmarc ]
SalutJe suis sous MySQL voici ma requetejai deux table t1 et t2 qui ont en gros une soixantaine d'entrer chacunneje veut faire ressortir les champ qui
somme terme a terme éléments d'un champ [ par negstar971 ]
Comment je dois faire si avec un table comme la suivante | relevé || 2 || 3 || 4 ||&nb
COMMENT FAIRE UN CHAMP like UN AUTRE CHAMP [ par Delph83 ]
Bonjour tout le monde Voilà j'ai un problème avec une requête sql et la clause LIKE : <P class=MsoNormal style="MARGIN: 0cm 0
Suppression de caracteres dans un champ TEXT [ par Sbt ]
Bonjour à tous, Dans une de mes tables, il y a un champ TEXT, nommé RES_TXT. Dans ce champ, on y insert tout un fichier texte, sur lequel on n'a pas
Insertion d'un résultat d'une requete [ par nounours21_6 ]
Bonjour a tousvoila, j'ai deux tables quasiment identiquela différence se porte sur un champdonc j'ai fais une procédure stockée sous SQL Server 2005
Requête avec champ Null [ par Blaster13 ]
Bonjour à tous,J'ai un petit souci et n'étant pas un champion du SQL ni du VBA je voulais savoir s'il existait une solution:Petit résumé:Pour faire si
Probleme de Requete [ par ehmarc ]
Salut à tous,Voila j'ai un soucis je possede une table X dans laquelle je fait une requete genre : select * from X where Champ = 'toto' ma requete mar
choix champs Texte ou Memo / optimisation [ par yan35 ]
Bonsoir,Je voudrais optimiser 1 base Access qui commence à ramer avec 40000 enregistrements d'une longueur de plus de 400 octets, dans 1 table.J'ai un
Insertion [ par le_totophe ]
Bonjour à tous, je voudrais gérer des contacts au sein d'une base de données qui comporte (schématiquement) une table avec un champ contact_id auto-in
aide [ par asmaa17 ]
salut,j'ai deux questions j'espere de vous m'aider pour les resoudre: 1-j'ai cree deja une table et j'ai oublié de mettre un champ en mode numero aut
Livres en rapport
|
Derniers Blogs
TECHDAYS PARIS 2010 : LA BI DANS SHAREPOINT 2010TECHDAYS PARIS 2010 : LA BI DANS SHAREPOINT 2010 par ROMELARD Fabrice
Animé par: Vincent Bellet et Baptiste Giraudier La BI dans SharePoint 2010, Les nouveaux services d'application dans SP2010 et SQL Server Reporting services 2008 R2. La BI dans SharePoint est généralisée pour tous afin de permettre à tous les coll...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice TECHDAYS PARIS 2010 : PLAN DE MIGRATION VERS SHAREPOINT 2010TECHDAYS PARIS 2010 : PLAN DE MIGRATION VERS SHAREPOINT 2010 par ROMELARD Fabrice
Animé par: Arnault Nouvel et Antoine Dongois Le processus à prendre : Apprendre (découvrir la plateforme) Préparer (documenter l'historique et choisir la méthode de MAJ) Test (Test de MAJ) Implémenter (Effectuer la MAJ) Valid...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice TECHDAYS PARIS 2010 : LA PLEINIèRE DU SECOND JOURTECHDAYS PARIS 2010 : LA PLEINIèRE DU SECOND JOUR par ROMELARD Fabrice
Après un retour sur l'histoire des TechDays de Paris et le fait que ce soit le plus gros event MS au monde (du fait de sa gratuité), le président de MS France (Eric Boustoullier) a fait une présentation de la vision Microsoft pour les années à venir...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice
Forum
PROCEDURE MYSQLPROCEDURE MYSQL par gearmat
Cliquez pour lire la suite par gearmat
Logiciels
DB-MAIN (9.1.0)DB-MAIN (9.1.0)DB-MAIN is a data-modeling and data-architecture tool. It is designed to help developers and anal... Cliquez pour télécharger DB-MAIN Xilisoft DPG Convertisseur (5.1.37.0120)XILISOFT DPG CONVERTISSEUR (5.1.37.0120)Xilisoft DPG Convertisseur offre aux fans de Nintendo DS une bonne solution leur permettant de dé... Cliquez pour télécharger Xilisoft DPG Convertisseur GraphicsGale (2.01.01)GRAPHICSGALE (2.01.01)GraphicsGale est un logiciel de PixelArt avec de nombreuse fonctionnalités permettant de réalisé ... Cliquez pour télécharger GraphicsGale Architecte 3D (Platinum 2010)ARCHITECTE 3D (PLATINUM 2010)Architecte 3D Platinium vous permet de concevoir facilement les plans votre future maison, de l'é... Cliquez pour télécharger Architecte 3D TeamViewer 5 (TeamViewer 5)TEAMVIEWER 5 (TEAMVIEWER 5)Dépanner un ami,expliquer une manipulation devient un jeu d'enfant.
Prise en main d'un autre ord... Cliquez pour télécharger TeamViewer 5
|